首页 > 资讯 > 国际 > 正文
2024-04-27 18:15

谷歌的Gemini 1.5 Pro刚刚安装了耳朵


最新版本的谷歌AI-Gemini 1.5 pro现在可以听到你说话了。

Gemini是谷歌重新命名的机器人,之前名为Bard, Gemini 1.5 Pro是该模型的最新版本,于今年2月向有限数量的开发者开放。Gemini 1.5 Pro能够处理文本、代码、视频和(现在)上传的音频流,包括来自视频的音频,它可以在没有相应的书面记录的情况下收听、分析和提取信息。

实际上,对音频文件的支持意味着用户可以使用Gemini 1.5 Pro从收益电话中收集信息,转录采访记录,或者用音频分析视频-基本上是任何类型的音频文件。人工智能可以处理的提示包括一个小时的视频、11个小时的音频、3万行代码或超过70万字的单流。

谷歌还将Gemini 1.5 Pro作为公开预览版提供给那些可以访问Vertex AI的人,但目前还没有公开测试。目前,大多数用户通过Gemini聊天机器人与谷歌的人工智能互动。