此外,微软的AI技术专家克莱门斯·希伯和霍尔格·肯恩提供了一些信息。其中肯恩解释了多模态人工智能的概念,而希伯则提供了一些用例,包括将电话呼叫的语音直接记录为文本等。微软过去几天发布了多模态语言大模型Kosmos-1和Visual ChatGPT的论文,希望将感知与LLM保持一致。让单个AI模型既能看文字图片,也能说话。
(8136338)
相关教程
2023-03-10
2023-03-15
2023-03-16
2023-02-07
2023-03-22
2023-05-17
2023-02-27
2023-03-21
2023-03-21
2023-03-10
2023-03-13
2023-05-26
2024-10-23
2024-10-22
2024-10-22
2024-10-21