第一屆ACM MM ESGMFM 2024(The 1st Workshop on Efficiency, Security, and Generalization of Multimedia Foundation Models at ACM Multimedia 2024)日前在澳大利亞墨爾本舉辦。ACM Multimedia作為國際多媒體領(lǐng)域頂級會議,也是中國計算機學(xué)會推薦的A類國際學(xué)術(shù)會議,涵蓋了多媒體研究的所有領(lǐng)域。
本屆ESGMFM由美圖旗下美圖影像研究院(MT Lab)攜手悉尼大學(xué)、香港城市大學(xué)、蒙納士大學(xué)多名學(xué)者共同舉辦,邀請了來自羅切斯特大學(xué)、樂卓博大學(xué)、CSIRO Data61等產(chǎn)業(yè)界與學(xué)術(shù)界的多名專家參與。
近年來,隨著基礎(chǔ)大模型能力的快速發(fā)展,也顯著增強了視覺、語言、語音等多模態(tài)模型的處理能力,但在實際應(yīng)用中也出現(xiàn)了一些值得關(guān)注的新問題,本次Workshop主要聚焦在多模態(tài)基礎(chǔ)模型的效率、安全性和泛化性等關(guān)鍵問題的探討。
美圖公司技術(shù)副總裁兼美圖影像研究院(MT Lab)負(fù)責(zé)人劉洛麒受邀參加,并介紹了美圖奇想大模型(MiracleVision)自2023年6月推出至今的技術(shù)進展,并分享美圖奇想大模型(MiracleVision)在圖像、視頻、設(shè)計及營銷等垂直領(lǐng)域的應(yīng)用,深入探討了大模型技術(shù)對于內(nèi)容創(chuàng)作生態(tài)帶來的改變。
劉洛麒表示,以大模型為代表的新一代人工智能正在高速發(fā)展,可以看到生成式AI技術(shù)已經(jīng)為我們的日常生活與工作帶來令人欣喜的改變。但與此同時,大模型也進入到商業(yè)化競爭的關(guān)鍵階段,在緊跟技術(shù)發(fā)展趨勢的同時,讓大模型的技術(shù)能力匹配市場需求,降低用戶使用AI產(chǎn)品的門檻,為生產(chǎn)力帶來實打?qū)嵉男侍嵘拍苷嬲芡ù竽P蛷穆涞刈儸F(xiàn)到反哺研發(fā)的閉環(huán)。
作為活動主辦之一,美圖公司自2022年以來,不斷加碼在AI領(lǐng)域的探索與布局,并致力于通過前沿AI技術(shù),提供圖像及視頻處理、視覺設(shè)計創(chuàng)作等功能。
公司方面表示,在生成式AI技術(shù)助力下,美圖將持續(xù)提升產(chǎn)品吸引力,加速對影像與設(shè)計工作流的整合,持續(xù)拓展AI技術(shù)在生產(chǎn)力場景的應(yīng)用邊界。