新闻中心

BBC联合评估多款AI新闻摘要表现,谷歌Gemini错误比例最高!

2025-10-30
浏览次数:
返回列表

生成式ai在信息整合上展现出巨大潜力,其产出的内容常常令人印象深刻。然而,深入探究便会发现,该技术在实际应用中依然存在诸多不足。

近期,欧洲广播联盟(EBU)与英国广播公司(BBC)联手对ChatGPT、Gemini以及Perplexity等主流AI系统在新闻摘要生成方面的能力进行了全面评估。这项研究的背景在于,当前已有约15%的25岁以下年轻人将AI作为获取新闻的主要渠道。

项目初期,BBC通过大规模问卷调查及六场焦点小组访谈,收集了公众对AI新闻工具的实际使用感受和观点,随后EBU将此项研究推广至国际层面。结果显示,大约42%的英国成年人认为AI生成内容具备准确性,而年轻用户群体对此的信任程度更高。但值得注意的是,高达84%的受访者表示,一旦发现事实性错误,他们对AI的信任将大打折扣。

那么,这些系统的“不准确”程度究竟有多高?用户又是否能察觉这些错误?研究揭示,大多数由AI生成的新闻摘要都存在问题。尽管各模型整体表现相近,但谷歌Gemini却成为显著例外——其错误总数最多,且严重错误的比例远超其他平台。

报告指出,Gemini存在的主要缺陷包括:

Mistral AI Mistral AI

Mistral AI被称为“欧洲版的OpenAI”,也是目前欧洲最强的 LLM 大模型平台

Mistral AI 182 查看详情 Mistral AI
  • 未能提供清晰可靠的资料来源链接
  • 无法有效区分真实信息与讽刺性内容
  • 过度依赖维基百科作为信息源
  • 缺乏必要的上下文支撑
  • 存在原文引用错误的情况

在为期六个月的观察期内,所有参与测试的AI系统均展现出一定程度的进步,新闻摘要的准确率普遍上升,其中Gemini的改进尤为突出。然而,即便如此,其整体表现仍明显逊色于其他竞争者。

报告链接:News Integrity in AI Assistants

以上就是BBC联合评估多款AI新闻摘要表现,谷歌Gemini错误比例最高!的详细内容,更多请关注其它相关文章!


# 谷歌  # gemini  # 英国  # 接棒  # 欧洲  # perplexity  # gpt  # chatgpt  # ai  # 工具  # 缺书网站建设方案小学  # 海南抖音seo品牌排行  # seo关键词优化文档  # 陕西网站建设小程序  # 确山网站推广电话  # 许昌seo营销推广技巧  # 推广营销是什么意思  # 网站优化知识文案  # seo优化推广哪家实惠  # 万科营销推广语  # 相关文章  # 暗讽  # 最多  # 又是  # 明年  # 的是  # 多款 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 为什么夸克运行不了  怎么把手机里爱奇艺的视频下载到u盘里  hp固态硬盘如何安装  手机拍显示屏有条纹怎么去除  春运抢票可以抢几次啊  春运抢票技巧攻略  如何发挥固态硬盘性能  净水器上的power是什么意思  春运抢票可以抢几次票  广东春运几点抢票  bugly是什么  爱奇艺vip会员可以同时几个人用?  华为5g手机掉了怎么定位找回  分享一个稳定的ao3镜像网址  vs怎么编写typescript  j*a数组对象怎么取  单片机怎么读取电流值  vi命令如何退出  复制 命令如何撤销  手机如何ip绑定域名解析  如何正确使用固态硬盘  5G类似微信的聊天软件有哪些  如何为服务器配置静态路由?服务器配置静态路由详细教程  360f4怎么取消百变壁纸  ai怎么找链接文件位置教程  如何显示固态硬盘  固态硬盘如何检查  市盈率300是什么意思  苹果16颜色有哪些  eraser是什么意思  苹果手机16系统有哪些  苹果16有哪些亮点功能  苹果的type-c接口是什么  typescript中文怎么读  酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南  如何提高固态硬盘速度  春运车票啥时候可以抢票  今天是农历多少号  交管12123协议头不完整是什么原因  python如何命令行换行  typescript如何遍历map  如果公司ttm市盈率为负数是什么意思  广东春运抢票怎么抢不到  科技型企业成长"十步法"  微波炉power中文是什么意思  如何使用ping命令  element ui是什么  苹果16改掉了哪些  如何判断固态硬盘  旧固态硬盘如何卖出 

搜索