Replies: 9 comments
-
2024-01-05 斯坦福大学开源的家务机器人Mobile ALOHA,能烧菜、做家务,并提供了DIY教程
官网地址(含论文、代码、教程):https://mobile-aloha.github.io/ Mobile ALOHA做家务视频:https://twitter.com/zipengfu/status/1742973258528612724 媒体报道: |
Beta Was this translation helpful? Give feedback.
-
2023-01-05 AI初创公司Perplexity AI在新一轮融资中获得总额7360万美元(约RMB5.28亿)
推文:https://twitter.com/perplexity_ai/status/1742915781690798290 媒体报道: |
Beta Was this translation helpful? Give feedback.
-
2023-01-03 大型语言模型(LLM)对于curl项目的安全工作所带来的问题和困扰
媒体报道:
|
Beta Was this translation helpful? Give feedback.
-
2024-01-05 美图AI视觉大模型MiracleVision(奇想智能)正式上线1月5日,美图公司自研AI视觉大模型MiracleVision(奇想智能)正式上线。 用户可通过MiracleVision(奇想智能)的官网进行体验,同时MiracleVision(奇想智能)的能力已应用于美图旗下产品,用户可前往美图秀秀体验文生图、图生图等功能,前往WHEE体验文生图、图生图、模型训练、局部修改、画面扩展等功能。 此外,美图公司正式向行业客户、合作伙伴全面开放MiracleVision(奇想智能)的模型能力,持续通过API、SDK、SaaS、模型训练等形式,助力多场景工作流,帮助企业降本增效。 MiracleVision(奇想智能)的官网:https://www.miraclevision.com/ |
Beta Was this translation helpful? Give feedback.
-
2024-01-05 科研期刊《Science》宣布引入 Proofig AI 检测图像欺诈,避免学术造假1 月 5 日消息,研究期刊《Science》今宣布,正引入一项名为 Proofig 的商业 AI 软件,该软件号称能够自动检测论文中的“欺诈性图像”,以避免学术造假。 《Science》期刊团队宣称已经利用 Proofig 软件进行了数月测试,这款 AI 软件据称能够准确识别经过裁剪、旋转、更改对比度的图像,并从中圈出可能存在“欺诈性”的图像,以便于人类编辑进一步检查。 此外,《Science》期刊团队还提到他们未来将推出一个名为“Policy Pak”的新闻周报集合,其中将收录各种“高时效性”的研究信息。 媒体报道: |
Beta Was this translation helpful? Give feedback.
-
2024-01-05 引入 AI 取代外包翻译工,语言学习平台多邻国已裁员数千人语言学习平台多邻国(Duolingo)此前在全球各地雇佣了大量的外包翻译工,为自家软件翻译学习内容及用户界面。 不过当前多邻国正逐步引入 AI 取代外包翻译工,Reddit 平台有用户发文声称该公司已裁去数千名员工,剩下的合同工日常内容也仅为审阅 AI 生成的内容,从而保证翻译质量。 多邻国的 CEO 相当看好 AI,认为“AI 是伙伴而非敌人”,此前多邻国还推出了 Duolingo Max 订阅服务,该服务整合了 OpenAI 的 GPT-4 大语言模型,用户可以与 Duo(多邻国的吉祥物)等人物角色进行“对话式”聊天。 媒体报道: |
Beta Was this translation helpful? Give feedback.
-
2024-01-06 MyShell 开源OpenVoice,只需一句话就能模仿你的声音OpenVoice 是一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音。 OpenVoice 不仅能够模仿参考发言人的音质,还可以精细控制包括情感、口音、语调、停顿和节奏在内的各种语音风格。除此之外,对于那些未在大规模发言人训练集中包含的语言,OpenVoice也可以实现“零样本”(Zero-shot)的跨语言模仿。 实测:目前对中文的支持不好,有电流音,情感的表现也不是很自然,要比elevenlabs的效果差。 第三方 |
Beta Was this translation helpful? Give feedback.
-
2024-01-06 阿里开源DreamTalk项目,能根据音频让人物照片说话、唱歌,同时保持嘴型和表情与音频一致
ssstwitter.com_1704274754586.mp4 |
Beta Was this translation helpful? Give feedback.
-
2023-01-04 Meta AI发布音频生成3D人物技术audio2photoreal,可以生成全身逼真的虚拟人物形象
|
Beta Was this translation helpful? Give feedback.
-
2024-01-04 阿里通义千问推出通义舞王功能,AI让全民热舞
阿里的通义千问APP上线通义舞王功能,用户只需上传一张照片,就能生成与照片匹配的舞蹈视频,内置了多种舞蹈模板,包括最近火热的科目三舞蹈。
媒体报道:
Beta Was this translation helpful? Give feedback.
All reactions