
OpenAI 尋日(13/12) 正式推出咗連 影像處理嘅 多模態功能 (同時處理文字、語音、圖像) 畀付費 ChatGPT 用戶使用,為 AI 同人類嘅互動帶嚟咗全新嘅突破。以往處理呢啲唔同形式數據,需要分開操作甚至人工整合,而家佢可以透過 實時視像 或者 屏幕共享 功能,同用戶用圖像及語音 實時互動,模擬人類嘅 實際對話 情景,效率同準確性都令人驚嘆。呢種程度嘅 即時互動性,喺現有嘅AI平台中係非常少見嘅。未了解有幾勁嘅朋友留言有預告片連結。
今日我測試吓,開住Camera同佢傾偈,認得晒我屋企內嘅擺設不在話下,為咗測試,我個仔匿埋喺張被裏便,唔出聲喺個房度行出廳,而我係事前冇任何提示,忽然擰個Camera過去,直接問佢呢嚿郁緊嘅嘢係咩嚟,佢完全知道喺張被裏面係有匿埋咗一個人,而且佢大概話「裏便一定有個好可愛嘅 little one玩緊hide and seek,聖誕節玩呢啲遊戲都好啱呀」。一個例子睇到晒佢能夠推測 物理現象 背後嘅成因、真實 家居配套、人類處境、社交禮儀。
呢個新功能已經反映到而家嘅 AI智慧 可能已經比起真人有過之而無不及,最特別嘅地方在於佢嘅 即時性 同 自然性,無論喺教育、商業或者 個人應用 上,都能夠提供更加貼心同靈活嘅體驗。例如,喺教育場景中,學生可以直接用視像同AI討論問題或者引導學生自己解決問題;喺 商業應用 上,企業可以利用呢個功能進行產品展示,直接詢問客人嘅需要而提供講解。甚至喺醫療同 支援殘障人士 嘅範疇,佢都可以用語音描述圖像,幫助 視障 人士。
佢而家只差一個肉體。想像一下將佢同 人形機械人 結合,會係點樣嘅場景。隨著移動機械人嘅技術近年亦越趨成熟,加上靈活嘅機械肢體同 擬人化 動態表現,以往我哋想像中同真人一樣嘅 機械人 可能好快唔再係科幻,或許喺未來10內就會有真正能夠進行 多模態交互、擁有 高度智能、流暢語音、即時反應、同有物理上互動能力嘅機械人,可以徹底改變人類世界。到時,呢啲機械人可能唔單止會成為工作同生活上嘅幫手,更會成為一種人類嘅夥伴,徹底改變我哋對智能、意識及生命嘅理解。
想認識多啲關於AI? 立即去睇下 AI 時代的入門知識





