首页 人工智能阿里开源更好角色一致性;万能变声器模型;OpenAI 与 Claude AI 客户端双双上新;ChatGPT Web 搜索工具

阿里开源更好角色一致性;万能变声器模型;OpenAI 与 Claude AI 客户端双双上新;ChatGPT Web 搜索工具

分类:人工智能
字数: 1420
评论: 0
阅读: 54

Cartesia 推出 Voice Changer:万能变声器模型

Voice Changer[1] 是由 Cartesia 推出的新模型,能够将任何语音转换为其他音色,同时保留源音频的情感,就像是一个变声器。这个功能可以广泛应用于配音、有声读物、游戏等领域。每月有 1 万字符的免费额度,你们可以自己试试。

阿里 SDXL-EcomID:更好的角色一致性

SDXL-EcomID[2] 是阿里开源的一种新方法,旨在提升角色一致性。它结合了 PuLID 和 InstantID 的优点,提供了更好的背景一致性、面部关键点控制、更真实的面部表现以及更高的相似度。此外,阿里还提供了原生实现的 ComfyUI 节点[3],包括写真工作流和换脸工作流,效果相当不错。有类似需求的用户可以试试看。

OpenAI 与 Claude AI 客户端双双上新

OpenAI 和 Claude AI 近期在客户端领域展开了一场‘军备竞赛’。OpenAI 宣布其高级语音模型现已支持 ChatGPT[4] 的 Mac 和 Windows 客户端。紧随其后,Claude AI[5] 也不甘示弱,迅速上线了其 Mac 和 Windows 客户端,未来 AI 客户端市场将如何发展,让我们拭目以待。

OpenAI ChatGPT 上线新 Web 搜索工具

ChatGPT 现在可以根据提示词或手动启动新的搜索功能[6],当搜索天气、股票、体育、新闻和地图时,用户界面将更加友好。

这一新功能将上线 Web 和全端客户端,并已向 Plus 和 Team 订阅用户推出。新的搜索模型是 GPT-4o 的微调版本,搜索接口直接对接 OpenAI 合作的数据提供方。未来还将推出搜索购物、旅行计划等功能,白嫖用户也不用急,未来几个月内将向所有免费用户开放。

Oasis:首款 AI 生成式游戏,开启无限探索

Oasis[7] 是首款可玩的 AI 生成式游戏,基于《我的世界》训练的实时互动世界模型。玩家可以通过键盘输入生成帧,进行移动、跳跃、破坏方块等操作,每次游戏都能构建和探索全新的地图。

目前开发团队正在计划开源模型架构、权重和研究。官网可以直接玩,不过我试了好久只能渲染第一帧,不知道为啥,你们快试试看。

Reference[1]

Voice Changer 产品介绍: https://www.cartesia.ai/blog/voice-changer

[2]

SDXL-EcomID 项目介绍: https://huggingface.co/alimama-creative/SDXL-EcomID/blob/main/README_ZH.md

[3]

原生 EcomID ComfyUI 节点实现: https://github.com/alimama-creative/SDXL_EcomID_ComfyUI

[4]

ChatGPT 下载: https://openai.com/chatgpt/download/

[5]

Claude AI 下载: https://claude.ai/download

[6]

ChatGPT 搜索功能介绍: https://openai.com/index/introducing-chatgpt-search/

[7]

Oasis 官网: https://oasis.decart.ai/



文章发布于: 2024-11-01 07:36:19
发表评论
😁 😅 🤣 😂 🙂 😊 😇 😍 🤩 😙 😘 😋 😛 🤪 😝 🤔 😮‍💨 😎 🤓 😓 😱 😭 👽