huozm32831 |
2023-05-11 11:58 |
北京时间今日凌晨,谷歌I/O全球开发者大会在加州山景城举行,与往年I/O大会安卓系统唱主角不同,今年的I/O大会是一场以AI为核心的大会,谷歌展现了一系列人工智能领域的最新技术成果。
谷歌母公司Alphabet CEO桑达尔·皮查伊(Sundar Pichai)表示:“我们正在重新塑造包括搜索在内的所有核心产品。”
在大会上,谷歌在今年的I/O大会上发布了多款基于其大型语言模型(LLM)的新产品。同时,谷歌正在将生成式AI整合到搜索引擎和其他产品中,例如可以生成草稿信息的Gmail,以及可以对图像进行重大修改的Google Photos。
大语言模型PaLM2亮相,实现端侧大模型 大模型作为目前人工智能行业的焦点,谷歌 在 I/O 开发者大会上宣布了全新的大语言模型 PaLM 2,据悉,PaLM 2是谷歌去年4月发布的PaLM语言模型的升级版本,它将为谷歌的更新版Gmail和 Bard 聊天工具提供支持,以挑战OpenAI的GPT-4。
据 谷歌 介绍,PaLM 2 在训练过程中使用了大量的数学和科学数据集,在逻辑和推理方面进行了广泛的训练,相比于去年的 PaLM 模型,PaLM 2 在多语言处理、推理和编码能力上有了显著的提升,并且接受了多语言文本训练,支持超过100种语言。
谷歌没有透露 PaLM 2 的具体参数规模,只是提到 PaLM 2 是基于最新的 JAX 和 TPU v4 计算设施构建的。谷歌对 PaLM 2 进行了算法优化,使得它在体积上比 PaLM 要小,但整体性能更强,计算效率更高 。
在介绍环节,谷歌也不忘对标一下“竞争对手” ,谷歌官方测试显示,PaLM 2 的部分结果(例如数学)比 GPT-4 还要优秀。
据悉,为了让模型的能力更灵活地服务于产品,PaLM 2分为四种规格,从小到大依次为Gecko、Otter、Bison和Unicorn,其中体积最小的Gecko可在移动设备上使用,每秒大约可处理20个Token,开发者们不用花费大量的时间和资源来创建和调整PaLM 2,而是能够直接拿来就用进行部署。
基于PaLM 2 微调,谷歌还展示了一种名为 Med-PaLM 的多模态大语言模型,专门用于医疗领域。它可以根据 X 光片诊断病人的伤情,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。
另一种是 Sec-PaLM 2,它是针对网络安全的大语言模型,它可以分析和解释潜在的恶意脚本,并评估其危险性。
谷歌表示,目前已有超过25个产品和App正在使用PaLM 2的能力。
Duet AI发布,全面对标微软Copilot Duet AI 是 Google Workspace 的最新工具,是谷歌在Workspace应用中提供的一系列AI工具的品牌名称,利用谷歌AI 技术提供智能辅助:
首先,Gmail移动应用现在将根据一个提示,在一个新的“Help me write(帮我写)”功能中为你草拟完整的电子邮件回复。此外,Gmail移动应用很快将增加上下文辅助功能,“让你能够创建自动填充姓名和其他相关信息的专业回复。”
Duet AI也出现在Google Slides中,与Midjourney或DALL-E 2类似,Duet AI现在可以将简单的文本提示(输入到Duet AI“Sidekick”侧边栏中)转换为AI生成的图像,以增强Slides演示文稿。它可以帮助您省去在互联网上寻找合适的幻灯片图像的麻烦,同时为它们增添一些原创性。基于此功能,Duet AI还可以在Google Meet中可以根据文本提示为视频通话生成自定义背景图像。
在Google Sheets中,Duet AI可以理解单元格数据的上下文,并相应地进行标记。电子表格应用程序还添加了一个新的“help me organize”(帮我整理)”功能,用于创建自定义计划。
Duet AI还在Google Docs的智能画布中增加了一个“assisted writing experience(辅助写作体验)”。输入一个描述你想写的内容的提示,就会生成一个Docs草稿。
此外Duet AI还增加了一套基于机器学习的Google Cloud开发者工具,它可以提供实时代码协助,并推荐生成的代码块,同时指出错误可,支持 Go、Java、Javascript、Python 和 SQL 等多种开发语言。
用AI重新定义搜索能力
会上,谷歌搜索也推出了全新的SEG(Search Generative Experience),在使用时会在一些查询的搜索结果的最顶部看到AI生成的答案,这些答案可以为你的搜索提供更多的上下文。你可以通过后续问题来缩小快照中的信息。这些AI快照是由Google在I/O上宣布的大型语言模型(LLM)的更新版本PaLM 2驱动的。这个新模型已经为25个谷歌服务提供支持,包括公司的Bard聊天机器人,并且在推理、编码和翻译方面有所改进。
更加多模态、多元化的Bard
谷歌宣布,旗下AI的聊天机器人Bard现在将对所有人开放,从周三起,向约180个国家开放申请使用Bard,并增加对韩语和日语的支持。同时该公司还增加了一系列新功能,让用户可以更容易地将生成的文本导出到Google文档和Gmail,加入了新的暗色模式和视觉搜索功能。谷歌还表示计划在未来为Bard添加更多功能,这包括使用Adobe的AI图像生成器Firefly的AI图像生成,以及与第三方服务如OpenTable和Instacart的集成。
面向AI的超算设施及学习工具 除了面向用户的功能升级外,谷歌还为开发者推出云端机器学习平台Vertex AI,增加了三款新的大模型:
Codey:text-to-code,可以帮助开发者编写代码;
Imagen:text-to-image,可以生成高品质的图片;
Chirp:speech-to-text,可以方便地进行语音转文字。
此外,在Vertex AI上还可以使用文本和图像的嵌入式API。它可以将文本和图像数据转换为多维数值向量、映射语义关系,从而让开发者创建出更加有趣的应用。
除了模型方面,谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和Nvidia H100结合,谷歌云能够提供更大的计算吞吐量和带宽,能够让企业更快开发机器学习模型。
“亲儿子”独享AI赋能的安卓14 相比AI占据了发布会的绝大多数时间,昔日的主角Android 14则成为了这次大会的配角,且同样为安卓 14 系统引入两项生成式 AI 特性,包括 Magic Compose 和生成式壁纸,其中后者为Pixel 设备独占。
其中,Magic Compose可以在安卓系统的默认短信(Messages)应用中,通过AI 可以根据消息内容生成回复文本。
而生成式 AI 壁纸,则是通过引入文本转图片扩散模型,允许用户输入 prompts,描述想要获取的图片信息,系统将会自动生成相应的壁纸。谷歌还表示,它有一种新的“电影壁纸”(cinematic wallpaper),使用设备上的机器学习网络将你最喜欢的照片转换为 3D 图像,当你解锁或倾斜设备时,这些图像会呈现立体效果,给人栩栩如生的感觉。
除了软件方面的升级之外,本次I/O大会上,谷歌还发布了售价1799美元的首款折叠屏手机Pixel Fold、直板手机Pixel 7a以及平板产品Pixel Tablet,而这些谷歌“亲儿子”产品将和该系列其他产品一样,率先获得最新版的安卓大版本的升级,以及Pixel的独享功能。
回顾谷歌 I/O 2023大会,可以说是一场拥抱AI、拥抱的大模型的大会。面对席卷全球的热潮,谷歌作为全球的互联网科技巨头,也难以逆势而行。尤其是在OpenAI、微软、百度、商汤、科大讯飞等企业纷纷推出大模型以强化自身业务能力,实现效能提升,谷歌也必然有所行动,用AI赋能现有的产品,供自己的江湖地位。
在I/O大会上谷歌推出的新功能上,速途网能够看出谷歌已经想着大模型领域迈出了更加坚实的一步,而为谷歌形成真正的优势,不仅要看谷歌在这场大模型的角力中能否脱颖而出,还要看能否与产品与服务更加深度的整合,以合力打造一把“后中争先”的利刃。 |
|