來源:光明日報
2021-03-21 06:13:03
原標題:讓殘障群體共享信息時代的陽光
來源:光明日報
這是一群人工智能領域的創新青年,他們致力于用科技力量拓展公益事業空間——
讓殘障群體共享信息時代的陽光
【解碼“新動力人群”】
2005年央視春晚上一支舞蹈《千手觀音》,讓聽障者這個群體走入大眾關注視野。
然而,人們不知道的是,坐回電視機前,由于春晚小品相聲等實時直播節目沒有字幕,《千手觀音》舞者們與中國超過2000萬聽障人士一樣,難以與家人共享同一份歡樂。
改變在2021年發生。春節前夕,由中國聾人協會指導研發、阿里巴巴達摩院免費提供語音技術的一款實時字幕機頂盒,讓聽障群體第一次看懂了春晚直播。
科技,正讓無聲世界變得生趣盎然。
自組建起,阿里巴巴達摩院人工智能團隊就默默投身公益,努力讓殘障者能夠參與到這個世界的對話中來。他們堅信,科技的發展,要讓人跨越殘障造成的鴻溝,再小的群體,也應該平等享受信息時代的紅利。
1、讓聽障者聽到:這個世界到底在“說”什么
2021年除夕之夜,在上海家中,《千手觀音》舞者呂曉燕第一次看懂了春晚中岳云鵬的相聲以及賈玲的小品。
從1983年央視舉辦第一屆春晚開始,雖然電視從模擬技術發展到數字技術,從標清技術發展到高清、超高清,但春晚直播字幕卻一直沒有實現。
“聽障群體的世界,不能沒有字幕。”呂曉燕說,手語是他們這個群體的通用語言,而字幕能讓他們知道,這個世界到底在“說”什么。
“2020年四五月間,有一個做字幕機頂盒的創業者與我們聯系,提出給直播節目加字幕的合作請求。”達摩院語音實驗室架構師唐璐說,用智能技術給直播節目同步加字幕看似簡單,但一旦出現錯字,對電視臺來說就是一個播出事故,所以行業一直持審慎態度。
“另外,在商業上也無利可圖,因為聾人群體太小眾了,太容易被社會忽視。”唐璐說,“而開發一個安全的算法并提供算力支持,需要很大的成本,對一般研發公司來說,這是無法承受的代價。”
“對聽障者群體來說,如果我們能讓實時字幕得以實現,就可以為他們打開一扇連通世界的大門。”唐璐覺得,“這是一個公益項目,總需要有人做。”于是,他寫了一個詳細的材料,向公司申請,免費開放算力給這個項目。
不久后,達摩院向這個創業項目開放了免費語音接口。獲得支持后,那個創業團隊很快弄出一個實時字幕機頂盒,在春節前上線銷售。
“為了達到最好的字幕效果,我們做了大量研發工作,針對新聞、娛樂、訪談等不同節目特點,以及娛樂口語、方言、俗語的特點,做了數十萬小時時長的標注,成本至少花了幾百萬元。”唐璐說。
“由于字幕的誤差小、延時低、便利性強,許多聽障人士還利用這款機頂盒上網課、開會、遠程辦公,將其當作自己的‘社交助手’。”達摩院語音實驗室負責人鄢志杰表示,“達摩院將持續輸出最先進的語音技術,幫助聽障群體消除與外部世界的信息鴻溝,為他們實現無障礙溝通、生活、工作提供長期公益支持。”
2、讓視障者看到:這個世界正在發生著什么
2020年11月1日零點,數億“尾款人”開始“雙十一”沖浪。在浙江富陽,雙目失明的蔡瓊卉將手機抓在耳邊,讀屏速度調快了4倍,手指上下翻飛,搶購、滿減、支付。靠耳朵,她在和幾億健康人一起“拼手速”搶購。
蔡瓊卉是中國1700多萬視障人群中的一員,像她一樣,600多萬視障人群已用上智能手機。信息技術,為他們鋪就了一條互聯網世界的“盲道”。
而這一切得以實現,要從2017年年底說起。這一天,達摩院視覺實驗室“讀光”團隊負責人王永攀收到一封郵件。致信者是一位盲人,他在郵件中說,希望手機淘寶能讓盲人也可以無障礙參與“雙十一”搶購。
“打造一個‘盲人版’的淘寶,商業成本是非常高的。”王永攀解釋說,“淘寶系統非常復雜,再全方位添加一層無障礙結構,在投入開發人員、增加服務器之外,還要面對系統穩定性、安全性的挑戰。”
那么,這個事情做不做?
“團隊是沒有猶豫的。”王永攀說,“我們不能只做錦上添花的事情。對視障者而言,這具備著雪中送炭的意義,可以實實在在地幫助他們融入社會、參與社會。”
完成這項工作,到底有多難呢?
“網頁上每天同時在架圖片達500多億張,類型包括廣告圖、商品圖、表格圖、圖文注解圖等。這就需要將文字、圖片以合理順序進行組織后,再為視障人士閱讀,幫助他們正常理解。”王永攀說,“另一個挑戰在于,信息轉換一定要極度準確,因為一個微小的錯誤,都會給盲人造成很大的麻煩。”
夜以繼日,“讀光”團隊不斷突破原有技術的局限,終于在2018年“雙十一”前成功為手機淘寶搭建了無障礙結構。后來,這一服務又推廣到飛豬、咸魚、支付寶、餓了么等平臺,在更大范圍讓視障者享受到信息時代的便利。
“無障礙功能的開發,要深刻體察用戶的真實需要。”達摩院視覺實驗室“讀光”產品經理傅詩楹介紹,針對殘障群體,“讀光”團隊用文字圖片識別技術,還開發了很多智能助殘輔具產品。比如,團隊與浙江大學合作,正在研發一款“讀書燈”,燈上有一個攝像頭,照到文字上即可用聲音讀出來,極大方便了盲人的學習與閱讀。還有一款“智能手杖”,能夠精確識別周邊環境,并用語音提示出來,從而更好地幫助盲人走出家門,回歸社會。
“信息時代的陽光,必須照進殘障群體的生活。”王永攀說,“這才是科技進步的應有之義。”
3、讓無助者感到:這個世界在關心著他
對一個在城市辛苦打拼的人來說,語音導航起的作用其實不只是導航。
“那天回家時超累超暴躁,這時手機導航里李佳琦說:‘佳琦的女孩一定要一直開心哦。’那一刻,我的心情頓時緩和了下來。”這是一位網友的感慨。
為什么現在的機器語音開始有了“感情”?
“以前通用語音合成,以信息傳達為主,聲音是非常冰冷的,比如醫院叫號、語音報站等。但我們做的項目多了,就感到視障群體對聲音非常敏感,他們渴望被溫暖地對待。”達摩院語音實驗室語音合成算法負責人李昊說,“技術的進步,要有社會責任感,讓溫暖的事情發生。”
鄢志杰說:“我們的語音合成技術與人工智能結合,已經可以實現很高水平的人機對話。達摩院在這方面做得非常前沿,已經通過準圖靈測試,合成語言可以很好地表達情感、交流信息。”
“正因如此,相關技術的應用范圍越來越廣。”李昊介紹,“例如,只要有一分鐘左右的語料素材,我們就可以將講故事的聲音合成為家長的,用于孩子的睡前伴讀。”
這一技術還可以幫助一些視力下降的老人或頸椎不好暫時不方便看文字的人。在非常特殊的情況下,這一技術也可以幫助一些失去親人的人,為他們保留一個再次聽到逝者聲音甚至與其交流對話的渠道,陪伴和慰藉他們,幫助他們慢慢從悲痛中走出來。
如今,因為達摩院讀光團隊的努力,數以百萬計的視障人士在家中享受著足不出戶,購遍全球的互聯網新生活。“很多盲人朋友反饋說,‘獨立購物、叫外賣解決了生活中的很多問題,讓我覺得自己是一個獨立的人了’。”傅詩楹說,“真正讓用戶能體會到科技對他們的關愛,這也讓我們更有動力。”
“團隊曾一度想專門給視障群體做一個簡化版淘寶,結果盲人朋友們都說不要。”傅詩楹說,“這讓我們意識到,殘障群體其實希望參與到正常的社會生活中來。無論在線下還是線上,他們都不希望生活在一個封閉的世界里。”
“信息技術最令人欣慰之處,就是它給每個人帶來平等。”鄢志杰說,“這也正是我們始終堅持的原則——讓選擇變得更容易,但是不能夠剝奪任何群體選擇的權利。”
(本報記者 羅旭)
想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網官方微博(@齊魯網)提供新聞線索。齊魯網廣告熱線0531-81695052,誠邀合作伙伴。