微軟又在開發新技術:教會AI看圖講故事
和谷歌一樣,微軟也在開發一項造福殘疾人士的新技術。如果這項技術能順利推出,這無疑將為盲人辨識視頻和圖片信息的道路上邁出了一大步
1
科客網
http://www.ue2382.cn/news/11253.html
科客點評:相比國內動不動的“黑科技”,這樣的科技才是改變生活的根本。
微軟的研究人員又有新的腦洞,他們想讓計算機以人工智能的方式,把幾張圖片里發生的事情給講述出來。今天,他們已將發表了關于這項技術的學術論文,旨在為了視覺損傷人士提供具體的圖片信息。
這項技術非常有意義,這不僅僅是遠超之前的圖片描述(Image Caption)技術。根據微軟研究員Margaret Mitchell的說法,這項技術不僅可以描述出照片的背景,而且還可以告訴你,在照片里,什么樣的人正在做了什么事。這是基于深度學習(deep learning)理論而開發的,之前微軟也把這種理論應用到語音識別和機器翻譯。目前,谷歌、Facebook和其他公司也在積極參與這項研究。
為了改善這個領域的現狀,微軟依賴人工把單張圖片的標題內容和特定的圖片順序寫出來。工程師再利用已有的信息教會機器,把圖片序列發生的事情復述出來。如上圖所示,單個圖片顯示出來的信息是一群年輕人圍著桌子坐一起,而經過序列處理后,描述出一群人在享受互相聊天的美好時光。
如果這項技術能順利推出,這無疑將為盲人辨識視頻和圖片信息的道路上邁出了一大步。關注科客網官方微信kekebat,獲取更多精彩資訊。(文/Poplar)
注:科客網原創文章,歡迎轉載與分享,轉載請注明出處。
如月千早
████████████看 黃 魸 手 機 瀏 覽 噐 咑 幵:275236.c○m 郗蒛資羱!無需下載、直接欣賞,妳嬞鍀!████████████追滋