转载请注明出处: CHATWEB
本文的链接地址: https://chatweb.com.cn/post-67.html
Cartesia 推出 Voice Changer:万能变声器模型
Voice Changer[1] 是由 Cartesia 推出的新模型,能够将任何语音转换为其他音色,同时保留源音频的情感,就像是一个变声器。这个功能可以广泛应用于配音、有声读物、游戏等领域。每月有 1 万字符的免费额度,你们可以自己试试。
阿里 SDXL-EcomID:更好的角色一致性
SDXL-EcomID[2] 是阿里开源的一种新方法,旨在提升角色一致性。它结合了 PuLID 和 InstantID 的优点,提供了更好的背景一致性、面部关键点控制、更真实的面部表现以及更高的相似度。此外,阿里还提供了原生实现的 ComfyUI 节点[3],包括写真工作流和换脸工作流,效果相当不错。有类似需求的用户可以试试看。
OpenAI 与 Claude AI 客户端双双上新
OpenAI 和 Claude AI 近期在客户端领域展开了一场‘军备竞赛’。OpenAI 宣布其高级语音模型现已支持 ChatGPT[4] 的 Mac 和 Windows 客户端。紧随其后,Claude AI[5] 也不甘示弱,迅速上线了其 Mac 和 Windows 客户端,未来 AI 客户端市场将如何发展,让我们拭目以待。
OpenAI ChatGPT 上线新 Web 搜索工具
ChatGPT 现在可以根据提示词或手动启动新的搜索功能[6],当搜索天气、股票、体育、新闻和地图时,用户界面将更加友好。
这一新功能将上线 Web 和全端客户端,并已向 Plus 和 Team 订阅用户推出。新的搜索模型是 GPT-4o 的微调版本,搜索接口直接对接 OpenAI 合作的数据提供方。未来还将推出搜索购物、旅行计划等功能,白嫖用户也不用急,未来几个月内将向所有免费用户开放。
Oasis:首款 AI 生成式游戏,开启无限探索
Oasis[7] 是首款可玩的 AI 生成式游戏,基于《我的世界》训练的实时互动世界模型。玩家可以通过键盘输入生成帧,进行移动、跳跃、破坏方块等操作,每次游戏都能构建和探索全新的地图。
目前开发团队正在计划开源模型架构、权重和研究。官网可以直接玩,不过我试了好久只能渲染第一帧,不知道为啥,你们快试试看。
Reference[1]
Voice Changer 产品介绍: https://www.cartesia.ai/blog/voice-changer
[2]
SDXL-EcomID 项目介绍: https://huggingface.co/alimama-creative/SDXL-EcomID/blob/main/README_ZH.md
[3]
原生 EcomID ComfyUI 节点实现: https://github.com/alimama-creative/SDXL_EcomID_ComfyUI
[4]
ChatGPT 下载: https://openai.com/chatgpt/download/
[5]
Claude AI 下载: https://claude.ai/download
[6]
ChatGPT 搜索功能介绍: https://openai.com/index/introducing-chatgpt-search/
[7]
Oasis 官网: https://oasis.decart.ai/
推荐阅读:
转载请注明出处: CHATWEB
本文的链接地址: https://chatweb.com.cn/post-67.html