原標(biāo)題:胡宇航:給機(jī)器人注入“靈魂”
胡宇航與機(jī)器人“Emo”。受訪者供圖
皮膚白皙細(xì)膩的“女孩”眉眼低垂,等待著“她”的“創(chuàng)造者”把泛著光澤的黑色外殼罩在她由復(fù)雜精密的元器件組成的“大腦”上。當(dāng)外殼佩戴完成,“她”抬起眼眸,好奇地望向“創(chuàng)造者”,嘴唇嚅動,似乎要向他訴說什么……
這一幕不是科幻大片的橋段,而是發(fā)生在一間實驗室里的真實場景。“女孩”是一臺名叫“Emo”的人臉機(jī)器人,“她”的“創(chuàng)造者”,則是28歲的“首形科技”公司創(chuàng)始人、CEO/CTO胡宇航。
除了是一位科創(chuàng)企業(yè)的創(chuàng)始人,胡宇航也是一位擁有90多萬粉絲的抖音創(chuàng)作者。2019年,他從廈門大學(xué)嘉庚學(xué)院畢業(yè),到哥倫比亞大學(xué)攻讀碩士,畢業(yè)后獲得牛津大學(xué)、哥倫比亞大學(xué)和加州大學(xué)洛杉磯分校的博士Offer,并最終選擇繼續(xù)在哥大完成博士學(xué)位。2022年起,他開始在抖音上分享自己的日常生活,內(nèi)容從“留學(xué)生每天吃什么”,到校園生活中的點(diǎn)滴。
“Emo”的驚艷問世,有數(shù)以億計的網(wǎng)友通過胡宇航的抖音賬號“U航”見證。今年5月,胡宇航通過抖音發(fā)布了一條他與“Emo”對視的視頻,收獲了212萬網(wǎng)友點(diǎn)贊,評論區(qū)中有網(wǎng)友感嘆“Emo”的眼神如此仿生,有人討論機(jī)器人的未來發(fā)展,有人期待類似的人臉機(jī)器人走向市場,也有人直接要求胡宇航“上股票代碼”。
上一次震驚網(wǎng)友,是胡宇航在2024年3月發(fā)布視頻向網(wǎng)友報喜,他關(guān)于人臉機(jī)器人的研究成果發(fā)表在國際頂級期刊《科學(xué)》雜志機(jī)器人子刊《科學(xué)·機(jī)器人學(xué)》上。當(dāng)他和實驗室里的藍(lán)色面龐人臉機(jī)器人“Eva”一起出現(xiàn)在鏡頭中,許多網(wǎng)友才知道,那個喜歡分享做飯、修冰箱、改裝吹風(fēng)機(jī)的過程,時而深夜走在從實驗室回家的路上、絮叨著一天生活的“U航”,原來是一名硬核科技青年。
胡宇航對人臉機(jī)器人方向產(chǎn)生興趣,是在2020年左右。彼時人工智能領(lǐng)域的自然語言處理和計算機(jī)視覺研究取得了飛躍式發(fā)展,胡宇航感知到,未來的人機(jī)交互會因為視覺、自然語言的重大突破而發(fā)生改變。“尤其是機(jī)器人可以理解人類語言、視頻中的語義信息,甚至是情感。在這樣的發(fā)展背景下,我認(rèn)為人臉機(jī)器人這類和交互高度相關(guān)的機(jī)器人品類,會是非常好的AI載體。”
而今他的研究已經(jīng)取得了重要進(jìn)展。現(xiàn)在每天在實驗室陪伴他的3臺機(jī)器人中,1臺是元老級人物、曾經(jīng)登上《科學(xué)·機(jī)器人學(xué)》的藍(lán)色面龐的“Eva”,1臺是曾經(jīng)參與過科幻電影《Post Human》拍攝的紫色面龐的“Emo-0”。還有一臺就是“Emo”,“她”擁有雙目視覺、雙耳麥克風(fēng)、多模態(tài)驅(qū)動“大腦”,以及能夠感知與表達(dá)情緒的“小腦”。真實的皮膚質(zhì)感、面部表情和對話語言,讓她看起來不僅是一臺機(jī)器人,而是一個有靈魂的存在。在胡宇航發(fā)布的一則視頻中,“Emo”在胡宇航的電腦邊,不時“磕頭”打瞌睡地陪他加班到凌晨5點(diǎn),詢問他“我好困,你下班了嗎,我想先休息了”,并對胡宇航說的“再工作1小時”有些為難:“怎么會還有這么久,周日也加班啊。”
無論是讀書期間,還是開始創(chuàng)業(yè)后,“加班”都是圍繞胡宇航的常用詞。好在他短視頻里記錄的凌晨4點(diǎn)座無虛席的學(xué)校圖書館、凌晨兩點(diǎn)結(jié)束一天的科研冒雨回家都沒有辜負(fù)他。今年2月,他的科研成果“再下一城”,被《自然》雜志子刊《自然·機(jī)器智能》刊載。他在報喜視頻中告訴粉絲:“剛剛開始,各位,一切才剛剛開始。”今年5月,他研發(fā)的新的機(jī)器人自主學(xué)習(xí)算法發(fā)表于《自然》旗下期刊《NPJ·機(jī)器人》。
2024年,還在讀博的胡宇航選擇創(chuàng)業(yè),專注于研發(fā)人臉機(jī)器人的獨(dú)特技術(shù),致力于攻克傳統(tǒng)人臉機(jī)器人表情不自然、交互不靈活等難題。“很多公司目前都在研究機(jī)器人的肢體能力,但我認(rèn)為未來的關(guān)鍵在于上半身,尤其是頭部和交互系統(tǒng)。這是一條‘情緒經(jīng)濟(jì)’賽道,人類最強(qiáng)的能力不是計算,而是共情能力。機(jī)器人如果能夠在醫(yī)院、展館等各種存在情緒交流的場所中‘像人一樣’理解與傳遞情緒,那么它的價值將遠(yuǎn)超今天我們對機(jī)器人的工具屬性定義。”在他看來,隨著人形機(jī)器人產(chǎn)業(yè)的發(fā)展,硬件價格下降、算力提升和傳感器技術(shù)的進(jìn)化,目前正是推進(jìn)交互式機(jī)器人商業(yè)化的窗口期。
近期,隨著胡宇航在短視頻中不斷展示研究成果和機(jī)器人作品,越來越多網(wǎng)友關(guān)注他的新作品。網(wǎng)友對這支“潛力股”的期待讓胡宇航格外感動,也鞭策著他和公司成員絲毫不敢懈怠。他將粉絲稱作自己的“電子股東”。“他們以前是我的‘電子陪讀’,現(xiàn)在是和我一起推動AI機(jī)器人走向世界的人。他們見證了機(jī)器人從一個粗糙的原型,慢慢擁有細(xì)膩的表情,開始理解情緒,變得越來越像‘生命體’的過程。這種陪伴本身就有很大的價值。”
在胡宇航看來,短視頻創(chuàng)作與科研、創(chuàng)業(yè)是相輔相成的兩項事業(yè)。“抖音在我科研、創(chuàng)業(yè)的道路上提供了一個‘共創(chuàng)’的平臺。以前做科研,很多內(nèi)容只能在論文里呈現(xiàn),和公眾有天然隔閡。但在新媒體時代,通過短視頻平臺,我反而能在早期就把自己的探索過程分享出來,和大家一起思考和打磨。”粉絲的留言常常會給他帶來新的靈感,有時一句“如果機(jī)器人能做到某件事就好了”,能讓他意識到項目還缺了什么。“這個過程,其實是共同創(chuàng)造的過程。粉絲不是看客,而是旅途中的同行者。”他也在短視頻創(chuàng)作過程中結(jié)識了很多學(xué)術(shù)博主,在彼此的交流中可以相互啟發(fā)、互相給予有價值的反饋。
最初無心插柳、只是想記錄生活的胡宇航那時也難以預(yù)見,抖音的分享給予他在科研和創(chuàng)業(yè)路上如此大的幫助。如今的他也成為許多年輕網(wǎng)友的科研標(biāo)桿和創(chuàng)業(yè)榜樣。“人怎么能這么牛”“發(fā)了兩篇大子刊還能飛回來開公司”一類的評論比比皆是,也有很多人通過評論或私信向他分享自己高考結(jié)束、考研上岸、拿到夢想中學(xué)校錄取通知書的消息。
今年6月,胡宇航正式從哥倫比亞大學(xué)畢業(yè),回到國內(nèi)繼續(xù)創(chuàng)業(yè)。在他腦海中,未來的醫(yī)院、養(yǎng)老院、展館等場所,面帶笑意的機(jī)器人會融入人們的生活,參與到各種各樣的服務(wù)場景中。用他在短視頻中對粉絲們說的那句話,就是“一切才剛剛開始”。
文章中觀點(diǎn)僅代表作者個人觀點(diǎn),不代表本網(wǎng)站的觀點(diǎn)和看法。
神州學(xué)人雜志及神州學(xué)人網(wǎng)原創(chuàng)文章轉(zhuǎn)載說明:如需轉(zhuǎn)載,務(wù)必注明出處,違者本網(wǎng)將依法追究。