中国首个接入大模型的Linux操作系统;ChatGPT支持图片和语音输入;抖音上线方言自动翻译功能丨RTE开发者日报Vol.57


开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@Asui,@CY,@墨镜


01 有话题的新闻

1、ChatGPT 更新:支持图片和语音输入

OpenAI 更新 ChatGPT,新增语音和图像输入功能,将于未来两周内向订阅用户推出。ChatGPT Plus 用户将率先体验到这些新功能。语音输入功能更加自然和便捷,答案质量更高。图像输入功能类似于 Google Lens,可以拍摄并上传照片,识别用户想要询问的内容,并进行多轮对话。但新功能也存在风险,OpenAI 表示会严格限制其使用范围,以确保安全性和合理性。

2、抖音上线方言自动翻译功能

9 月 25 日消息,近期抖音正式上线地方方言自动翻译功能。创作者可以使用该功能,「一键」将粤语、闽语、吴语、西南官话、中原官话等方言视频转化出普通话字幕。

据了解,来自火山引擎的技术团队采用了自研的自监督预训练模型和多语言翻译模型,实现了极少量标注数据条件下识别方言的能力,且训练效率提升一倍,有效有效提升了多语言翻译的性能,同时大幅降低了模型训练的资源消耗。「基于日常服务抖音集团业务的技术积累,抖音方言字幕可实现超低延时和高准确率」,其团队负责人表示。(@新浪科技)

3、全球最大商业图库 Getty Images 将推出图片生成工具,允许用户利用授权图片进行训练

9 月 25 日消息,据 The Verge 报道,全球最大的商业图库 Getty Images 将与英伟达合作推出生成式 AI 工具 Generative AI by Getty Images。

据介绍,这款工具允许用户在 Getty Images 庞大的图库中进行训练,也意味着任何使用这种工具、商业发布该工具创作图片的人都会受到法律保护。Getty Images 使用了英伟达生成式 AI 模型库 Picasso 上提供的模型「Edify」来开发这款工具。Getty Images 曾在去年 9 月宣布禁止上传和卖使用 DALL-E、Midjourney 和 Stable Diffusion 等 AI 艺术工具生成的插图。

定价方面,Getty Images 表示该工具将与标准版的 Getty Images 订阅进行分开定价。用户对其生成的图像享有永久性、全球化和无限制的权利,不过 Getty 会给生成的图片打上水印,以强调这是一张由 AI 生成的图片。(@IT 之家)

4、中国首个接入大模型的 Linux 操作系统来了

9 月 22 日,统信软件运营的深度社区正式官宣 deepin 成为首个接入大模型的开源操作系统。统信软件高级副总经理、CTO 张磊表示,“目前 UOS AI 实现了国内外主流大模型的能力接入,并封装成 deepin 的 AI 底层公共能力;同时,我们也将把 UOS AI 逐步开源给第三方应用,让更多应用可以在 deepin 上直接调用大模型。”(@CSDN)


02 有态度的观点

1、GitHub 首席执行官 Thomas Dohmke:AI 无法取代程序员

据外媒 TechCrunch 报道,GitHub 首席执行官 Thomas Dohmke 最近在 TC Disrupt today 活动中分享了他对于人工智能和软件开发之间关系的看法。Thomas Dohmke 认为,在 Copilot 及其相关 Copilot Chat 等辅助工具的推动下,人工智能和软件开发现在已密不可分,凭借这些软件,微软已经将 AI 这一技术扩展到了个人消费者。

Thomas Dohmke 坚持认为,滚雪球式的人工智能革命不会给软件开发行业敲响丧钟。他长期以来一直坚持认为 Copilot 等 AI 工具只是用于提高开发者的工作效率,而非取而代之。(@TechCrunch)

2、Reid Hoffman:AI 不应该是人工智能的缩写,而是增强智能

LinkedIn 联合创始人 Reid Hoffman 本月上旬在意大利博洛尼亚大学的毕业典礼上发表演讲。在演讲中,Hoffman 提到,AI 将重塑我们所有人的生活,它将成为我们用来做决策和引导生活的主要技术。「我们手中拥有这项技术,而不是相反。有了它,我们就有机会增强和定义人类的未来」。「AI 不应该是人工智能(artificial intelligence)的缩写,而应该是增强智能(amplification intelligence)的缩写,因为它有增强和提升我们的潜力」。

对于 AI,Reid Hoffman 鼓励「我们专注于塑造工具,进而塑造我们」,在这个任务的基础上,他提供了 3 个问题供考虑:

  • 第一个问题是,我如何制造更好的工具?
  • 第二个问题同样重要,但可能会让人意想不到:我如何让世界更美丽?
  • 第三个问题是,我如何制造更好的工具和增加美丽,以造福我的同胞人类?(@华尔街见闻)

3、黄奇帆最新演讲:中美 AI 大模型至少有两年以上差距

9 月 24 日,第五届外滩金融峰会上,中国国家创新与发展战略研究会学术委员会常务副主席、重庆市原市长黄奇帆提到,中美两国在数字经济领域竞争激烈。黄奇帆表示:“近期,以 ChatGPT 为代表的美国大模型技术创新大大加速人工智能发展,我国与之差距至少在两年以上,且差距呈快速拉大趋势。大模型技术将重塑生产消费各类经济业态,创造大量新的应用场景和生态,若不能及时跟上,我国可能在新一轮数字经济竞争中处于劣势和被动。”

黄奇帆认为,制约当前中国数字经济加速发展的主要难点包括数据确权、交易、跨境流动等问题,而这些问题往往牵一发而动全身,一旦出险必殃及全局。因此,有必要采取先局部试点再完善推广的改革策略。(@财经杂志)


写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

推荐阅读
相关专栏
资讯
89 文章
本专栏仅用于分享音视频相关的技术文章,与其他开发者和声网 研发团队交流、分享行业前沿技术、资讯。发帖前,请参考「社区发帖指南」,方便您更好的展示所发表的文章和内容。