👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩@韩信子
🎡 『谁在假唱』技术手段分析跨年演唱会上的歌手们
各大卫视的跨年演唱会,你追了几场?看出来了谁在对口型?B站Up主 @码农高天 使用 🚧Spleeter 软件将人声与伴奏音乐进行分离,并使用 🚧parselmouth 库对歌手进行音准分析,添加“准确音”辅助线后就可以分析歌手唱得准不准了。
注意!在体育馆等的大型晚会场馆中,即便如邓紫棋、孙楠、周深、张杰这样的稳定性顶尖的歌手,音准也会有波动。那么,完美卡在音准线上的,基本就是提前修音的假唱了!下面这些,都是假唱。(来源:BV123411m77L)
ShowMeAI 🎡AI应用与工具大全 页面,汇总了100+人工智能工具,包括个人、企业、行业、科研等4大应用场景,智能家居、增强现实AR、运动健康、聊天机器人、广告营销、教育、农业、无人机、自动驾驶、文本生成、图像生成等领域!是AI开发者和数字行业工作者的百宝箱!如有遗漏或推荐,欢迎联络留言!
🎡 『Apple · AI narration』苹果推出多部采用AI朗读的有声读物
苹果使用语音合成技术开发 AI 机器人并朗读的多部有声读物,悄然上线了!在苹果 Books 应用中搜索“AI narration”关键词即可看到。苹果这一举动可能代表着科技大厂对有声读物态度的重大转变。
近年来,有声读物市场火爆,科技公司争先恐后地站稳脚跟。预计到 2030 年,全球市场价值可能超过 350 亿美元。(来源:IT之家)
🔥 『Twitter』开启第三轮裁员,目标是业务数据科学团队
推特在第三轮裁员中,裁减了约40名从事某些方向业务(如下图)的数据科学家和工程师。此番裁员的目标是推特管理层眼中的“失败领域”和不重要的业务范围,分别以相应业务产品和数据科学为首。(来源:The Information)
🔥 『Mojo Vision』智能隐形眼镜初创企业裁员75%
初创公司 Mojo Vision 花费了几年时间研发智能隐形眼镜 Mojo Lens,眼镜内置了智能显示屏。在周五一篇博文里,公司表示近期的工作重点将转移到它开发的用于智能触点的微型LED显示技术上,并裁员 75%。首席执行官 Drew Perkins 表示,即使我们在产品开发方面取得了重要进展,Mojo 在筹集资金方面也面临着重大挑战。(来源:cnBeta)
🔥 『2023年1月编程语言排行榜』 2022年度最佳编程语言是 C++
Tiobe 公布了2023 年1月编程语言排行榜中,评选 C++ 为 2022 年度最佳编程语言,获得了最大的流行度增长值4.62%。C++ 受欢迎的原因是它出色的性能,以及近期不断发布具备有趣功能的新语言标准。
本月排行榜第1名的 Python 流行度增长了 2.78%,亚军 C 语言流行度增长了 3.82%。值得注意的是,Java 流行度增长了 1.55%,排名从第三位下滑到了第四位。(来源:IT之家)
🔥 『DoNotPay』全球首个 AI 律师即将出庭,为超速驾驶案被告做辩护
全球首个“AI 律师”将于下月出庭,在开庭审理的超速驾驶案件中为被告提供辩护。只不过这位律师没有实体,而是在手机端运行,帮助被告应对各种提问。
AI 律师的研发公司为 DoNotPay,负责人表示如果 AI 律师提供的建议不能帮助客户,DoNotPay 将会承担罚款。目前尚未公开案件被告的身份,也不清楚届时是否会向媒体开放。(来源:New Scientist)
🔥 『字节跳动』与摩根大通合作,或进军支付领域
据《福布斯》报道,摩根大通正在与字节跳动合作,帮助字节跳动开发支付技术,或为 TikTok 的支付渠道铺路。报道称,字节跳动将聘请摩根大通来简化交易,改善支付的发送和接收方式,并为字节跳动的十几种产品(包括 TikTok 和抖音)建立一个集中的银行账户。此外,字节跳动还聘请了几位摩根大通高管来领导其全球支付团队,推进金融业务。
根据数据分析公司Sensor Tower的数据,2022年全球用户在TikTok上的花费为34亿美元,高于前一年的20亿美元。仅在美国,这一数字就增长了两倍多,达到6.7亿美元。(来源:界面新闻)
🔥 『微软』计划投资自动驾驶卡车企业 Gatik
两位知情人士透露,微软计划在 Gatik 最新一轮融资中对其投资。而 Gatik 将使用微软的云计算和边缘计算平台 Azure 来开发卡车的自动驾驶送货技术。消息人士称双方的交易条款依然有可能发生变化。
公开信息显示,Gatik 成立于2017年,专注于零售业的中间环节以及B2B物流。2021年以来,Gatik 与沃尔玛和 Loblaw Companies 合作推出了完全无人驾驶的商用送货服务。(来源:路透社)
🚧 『minGPT』使用 PyTorch 重新实现 GPT
https://github.com/karpathy/minGPT
minGPT 项目使用 PyTorch 重新实现了 OpenAI GPT 的训练和推理功能,并试图变得小、干净、可解释,因为目前大多数可用的 GPT 模型都比较庞大。minGPT 库包含 mingpt/model.py
、mingpt/bpe.py
、mingpt/trainer.py
三个文件。
🚧 『unilm』跨任务、语言和模式的大规模自监督预训练模型
https://github.com/microsoft/unilm
微软开源的大规模自监督预训练模型,包括“人工智能基础知识”和“预训练模型”两部分。目前已经收获了 7,800 Star!将
人工智能基础知识
- TorchScale:DeepNet、Foundation Transformers (Magneto)、Length-Extrapolatable、X-MoE
预训练模型
- General-purpose Foundation Model:MetaLM
- Language & Multilingual:UniLM、InfoXLM/XLM-E、DeltaLM/mT6、MiniLM、AdaLM、EdgeLM、SimLM、E5
- Vision:BEiT/BEiT-2、DiT
- Speech:WavLM、VALL-E
- Multimodal (X + Language):LayoutLM/LayoutLMv2/LayoutLMv3、LayoutXLM、MarkupLM、XDoc、UniSpeech、UniSpeech-SAT、SpeechT5、SpeechLM、VLMo、VL-BEiT、BEiT-3
- Toolkits:s2s-ft、Aggressive Decoding
- Applications:TrOCR、LayoutReader、XLM-T
🚧 『ChatGPT Chrome Extension』ChatGPT 的浏览器插件
https://github.com/gragland/chatgpt-chrome-extension
一个 Chrome 扩展程序,可以更好地使用 ChatGPT 完成撰写推文、修改电子邮件、完善编程错误或其他任何需求,将 ChatGPT 添加到互联网的每个文本框中!