🦉 AI新闻
🚀 比尔・盖茨谈AI市场狂热现象
摘要:微软联合创始人比尔・盖茨在《下一个伟大的构想》播客节目中表示,目前AI市场的狂热程度远超互联网泡沫,准入门槛低,融资额巨大,处于前所未见的狂热状态。虽然AI在全球经济中的占比还小,但其潜力巨大,小型机构也能利用AI工具与大型机构竞争并提供优质服务。
🚀 腾讯推出TransAgents文学翻译框架
摘要:7月4日,腾讯AI实验室发布了专门用于超长文学内容翻译的TransAgents框架,支持中文、英文、日文、韩文等多种语言。该框架模拟传统翻译出版过程,包含高级编辑、初级编辑、译者和校对员等角色,翻译成本仅为人类译者的1/80。评估结果显示,TransAgents在领域特定知识方面表现超越了人类翻译。
🚀 腾讯混元文生图模型开源,显存需求降至6G
摘要:腾讯混元文生图模型(混元 DiT)发布小显存版本,显存需求仅6G,同时开源打标模型“混元 Captioner”。混元 DiT 还升级至1.2版本,并与 Hugging Face 合作适配多种插件。开发者可通过 Kohya 界面低门槛训练专属模型。混元 Captioner 在图片描述上进行了优化,提升了数据质量和准确度。
🚀 商汤科技发布可控人物视频生成大模型Vimi
摘要:商汤科技在世界人工智能大会上发布了首个“可控”人物视频生成大模型Vimi。通过一张照片即可生成与目标动作一致的人物视频,并支持多种驱动方式,如视频、动画、声音和文字等。Vimi不仅实现了精准的表情控制,还能生成自然的肢体变化、头发、服饰及背景变化,稳定生成1分钟单镜头视频,满足娱乐互动需求。Vimi将面向C端用户开放使用,更适合视频剪辑和再创作。商汤将在明日公布更多细节,IT之家将持续关注报道。
🚀 小语言模型挑战大语言模型主流地位
摘要:xLAM-1B 以其 10 亿参数在特定任务中击败了更大规模的 GPT-3.5 Turbo 和 Claude-3 Haiku,展示了小语言模型在数据处理创新上的优势。通过高效数据生成和验证方法,像 xLAM-1B 这样的模型在端侧 AI 应用中表现出色,打破了大模型主导的传统观念,推动AI向资源高效和本地化方向发展。