新闻中心
-
11-13连葫芦娃都数不明白,解说英雄联盟的GPT-4V面临幻觉挑战让大模型同时理解图像和文字可能比想象中要难。在被称为「AI春晚」的OpenAI首届开发者大会拉开帷幕后,很多人的朋友圈都被这家公司发布的新产品刷了屏,比如不需要...
-
11-11百度王颖:百度文库以AI创作能力突破语言边界,促进思想碰撞和文化融通11月9日,2023年世界互联网大会乌镇峰会“网络传播与文明交流互鉴论坛”召开。百度副总裁、互娱和垂类平台负责人王颖出席并发表“以技术搭建跨文化交流桥梁”主题演...
-
11-07微软发布 7 款针对对话优化的人工智能语音,更加逼真自然IT之家11月6日消息,人工智能技术的进步,对语音合成(TTS)的自然性和表现力的需求越来越高。上个月,微软发布了三种专为对话场景设计的新型逼真的人工智能语音。...
-
09-28Spotify 测试AI新功能:克隆播客主播的声音并将其翻译成其它语言IT之家9月25日消息,Spotify正在测试一项新的人工智能功能,该功能名为“语音翻译(VoiceTranslation)”,该功能可以克隆播客主播的声音,并...
-
09-27机器人同传来了!Spotify推AI语音翻译功能 马斯克惊叹美国流媒体巨头Spotify近日为播客推出了一项新的人工智能语音翻译功能,赢得了X公司老板埃隆·马斯克的赞誉。Spotify正在测试一项新的人工智能功能,该功能...
-
06-30谷歌AudioPaLM实现「文本+音频」双模态解决,说听两用大模型大型语言模型以其强大的性能及通用性,带动了一批多模态的大模型开发,如音频、视频等。语言模型的底层架构大多是基于Transformer,且以解码器为主,所以无需过...

