当前位置: 首页 > news >正文

[AI Google] Ask Photos: 使用Gemini搜索照片的新方法

借助Gemini模型,将Google Photos提升到一个新的水平。

Illustration of Ask Photos with Gemini feature in Google Photos mobile app with the prompt “What can i help you with?”

Google Photos是我们最早以AI为核心构建的产品之一,让你能够搜索照片和视频中的人、宠物、地点等。现在,我们通过我们最强大的AI模型Gemini对Google Photos进行重大升级。通过Ask Photos这一将在未来几个月内推出的最新实验功能,你可以更轻松地寻找特定记忆或回忆相册中的信息。

更直观地找到合适的内容

每天有超过60亿张照片上传到Google Photos。随着人们的相册不断增加,找到所需内容可能会导致浏览大量照片和视频,即使你拥有正确的关键字组合。通过Ask Photos,你可以自然地询问你要找的东西,比如:“展示我去过的每个国家公园的最佳照片。”Google Photos可以显示你需要的内容,帮你省去所有的浏览麻烦。

提问,获得有用的答案

我们经常拍照以捕捉记忆或保存重要细节,但这些照片中的信息可能会被遗忘。Ask Photos在你询问有关生活的问题时,为你揭示这些信息,比如你去年在哪里露营或你的代金券何时到期。Gemini的多模态功能可以理解照片的上下文和主题,从而提取细节。例如,你可以问:“我们给Lena办的生日派对主题有哪些?”Ask Photos将理解背景中的装饰或生日蛋糕上的细节,以给出答案。

除了搜索,获得更多任务帮助

借助Gemini模型,在Google Photos中完成任务也变得更加容易。例如,在一次长途旅行结束时,挑选最佳照片与朋友和家人分享可能会令人望而生畏。Ask Photos可以帮助你更轻松地创建旅行亮点。你只需询问,它会推荐顶级照片,甚至为你写一个个性化的标题以分享到社交媒体上。

Ask Photos的工作原理

  • 理解你的问题:Ask Photos理解你的查询,然后制定计划来找到答案。它代表你发出复杂的搜索,不仅识别相关的关键字,如地点、人物和日期,还包括自然语言概念,如“主题生日派对”。
  • 构建响应:下一步是研究搜索结果,找出哪些是最相关的,哪些似乎是你要找的。Gemini的多模态功能可以帮助准确理解每张照片中发生的事情,甚至可以在需要时读取图像中的文本。然后,Ask Photos会构建一个有用的响应并选择要返回的照片和视频。
  • 确保安全和记住纠正:尽管Ask Photos是实验性的,并且不会完全正确,但我们采用了多层次的保障措施和AI模型,以帮助确保响应的安全性和适当性。如果你纠正了答案或提供了额外的信息,Ask Photos可以记住这些细节以供将来使用。

如何保护你的隐私

照片中的信息可能非常个人化,我们非常认真地对待保护它的责任。你在Google Photos中的个人数据永远不会用于广告。除非在极少数情况下为了解决滥用或危害问题,否则不会有人审查你在Ask Photos中的对话和个人数据。我们也不会在Google Photos之外的任何生成式AI产品上训练这些个人数据,包括其他Gemini模型和产品。正如往常一样,你在Google Photos中的所有数据都受到我们行业领先的安全措施的保护。

未来几个月内试用Ask Photos

Ask Photos是一项实验性功能,我们即将开始推出,并将陆续添加更多功能。我们迫不及待地希望你试用并分享反馈,以便我们能在共同构建Google Photos的下一篇章时,使其更加实用。


  • 原文
  • 博客 - 从零开始学AI
  • 公众号 - 从零开始学AI

相关文章:

  • Windows线程同步的四种方式和区别
  • 音视频开发13 FFmpeg 音频 相关格式分析 -- AAC ADTS格式分析
  • 【postgresql初级使用】触发器的创建删除,你不知道的触发器函数中的系统变量,数据一致性还可以这样来保证
  • EasyExcel实现导入导出
  • 多语言for循环遍历总结
  • 2020长安杯
  • Java赋值运算符的使用技巧,你Get了吗?
  • 【Unity Shader入门精要 第12章】屏幕后处理效果(二)
  • Attention Is All You Need--论文笔记
  • C++ Primer Chapter 1 Getting Started
  • OceanBase开发者大会实录-李楠:4条路径+6大方案,关键业务系统数据库的升级之路
  • 多线程知识-11
  • 微信小程序登录接口
  • Prop 和 State 有什么区别?
  • AGP8+ android.useNewApkCreator‘ is deprecated 打包失败
  • 网络传输文件的问题
  • 实现windows 窗体的自己画,网上摘抄的,学习了
  • C# 免费离线人脸识别 2.0 Demo
  • ComponentOne 2017 V2版本正式发布
  • DOM的那些事
  • es6(二):字符串的扩展
  • FineReport中如何实现自动滚屏效果
  • Hexo+码云+git快速搭建免费的静态Blog
  • JAVA并发编程--1.基础概念
  • JS字符串转数字方法总结
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • Netty源码解析1-Buffer
  • Python socket服务器端、客户端传送信息
  • Redis 中的布隆过滤器
  • Redis中的lru算法实现
  • yii2权限控制rbac之rule详细讲解
  • 爱情 北京女病人
  • 测试开发系类之接口自动化测试
  • 技术:超级实用的电脑小技巧
  • 坑!为什么View.startAnimation不起作用?
  • 来,膜拜下android roadmap,强大的执行力
  • 你真的知道 == 和 equals 的区别吗?
  • 如何选择开源的机器学习框架?
  • 使用前端开发工具包WijmoJS - 创建自定义DropDownTree控件(包含源代码)
  • 通过git安装npm私有模块
  • 原创:新手布局福音!微信小程序使用flex的一些基础样式属性(一)
  • 中文输入法与React文本输入框的问题与解决方案
  • MyCAT水平分库
  • #Js篇:单线程模式同步任务异步任务任务队列事件循环setTimeout() setInterval()
  • #我与Java虚拟机的故事#连载01:人在JVM,身不由己
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (31)对象的克隆
  • (C#)if (this == null)?你在逗我,this 怎么可能为 null!用 IL 编译和反编译看穿一切
  • (阿里云万网)-域名注册购买实名流程
  • (八)光盘的挂载与解挂、挂载CentOS镜像、rpm安装软件详细学习笔记
  • (六)软件测试分工
  • (原創) 博客園正式支援VHDL語法著色功能 (SOC) (VHDL)
  • (转)Linq学习笔记
  • (转)Linux下编译安装log4cxx
  • (转载)CentOS查看系统信息|CentOS查看命令