AI新闻动态（2023-12-31到2024-01-06） #43

大型语言模型（LLM）：文章提到了大型语言模型（LLM），它是一种具有强大自然语言处理能力的模型。LLM在许多领域都有广泛的应用，但它也引发了一些安全方面的担忧。
curl项目：文章指出，curl是一个广泛使用的开源项目，用于在命令行和脚本中进行网络请求和传输数据。然而，由于LLM的出现，curl项目面临着一些安全问题。
安全问题：LLM的强大语言生成能力可能会导致curl项目中的安全漏洞。由于LLM可以生成具有误导性或有害意图的代码、指令或响应，这可能会对curl的使用者造成潜在的风险和威胁。
鉴别和防范措施：文章提到了一些鉴别和防范措施，以帮助curl项目避免由LLM引起的安全问题。这包括对输入和输出进行严格的验证和过滤，以防止恶意代码的注入和执行。
社区的观点：文章还引用了一些开发者和社区成员的观点。有些人认为，LLM的出现增加了软件开发和维护的复杂性，需要更加谨慎地处理输入和输出。然而，也有人对LLM的应用前景持乐观态度，并认为通过适当的安全措施可以充分利用其优势。

媒体报道：

oschina: 大模型 LLM 对 curl 项目的安全工作造成了困扰

0 replies

ikaijua · 2024-01-06T05:08:34Z

ikaijua
Jan 6, 2024
Maintainer Author

2024-01-05 美图AI视觉大模型MiracleVision（奇想智能）正式上线

1月5日，美图公司自研AI视觉大模型MiracleVision(奇想智能)正式上线。

用户可通过MiracleVision(奇想智能)的官网进行体验，同时MiracleVision(奇想智能)的能力已应用于美图旗下产品，用户可前往美图秀秀体验文生图、图生图等功能，前往WHEE体验文生图、图生图、模型训练、局部修改、画面扩展等功能。

此外，美图公司正式向行业客户、合作伙伴全面开放MiracleVision(奇想智能)的模型能力，持续通过API、SDK、SaaS、模型训练等形式，助力多场景工作流，帮助企业降本增效。

MiracleVision(奇想智能)的官网：https://www.miraclevision.com/

美图公司：美图AI视觉大模型MiracleVision（奇想智能）正式上线

0 replies

ikaijua · 2024-01-06T05:19:07Z

ikaijua
Jan 6, 2024
Maintainer Author

2024-01-05 科研期刊《Science》宣布引入 Proofig AI 检测图像欺诈，避免学术造假

1 月 5 日消息，研究期刊《Science》今宣布，正引入一项名为 Proofig 的商业 AI 软件，该软件号称能够自动检测论文中的“欺诈性图像”，以避免学术造假。

《Science》期刊团队宣称已经利用 Proofig 软件进行了数月测试，这款 AI 软件据称能够准确识别经过裁剪、旋转、更改对比度的图像，并从中圈出可能存在“欺诈性”的图像，以便于人类编辑进一步检查。

此外，《Science》期刊团队还提到他们未来将推出一个名为“Policy Pak”的新闻周报集合，其中将收录各种“高时效性”的研究信息。

science文章： https://www.science.org/doi/10.1126/science.adn7530

媒体报道：

IT之家：科研期刊《Science》宣布引入 Proofig AI 检测图像欺诈，避免学术造假

0 replies

ikaijua · 2024-01-06T05:23:42Z

ikaijua
Jan 6, 2024
Maintainer Author

2024-01-05 引入 AI 取代外包翻译工，语言学习平台多邻国已裁员数千人

语言学习平台多邻国（Duolingo）此前在全球各地雇佣了大量的外包翻译工，为自家软件翻译学习内容及用户界面。

不过当前多邻国正逐步引入 AI 取代外包翻译工，Reddit 平台有用户发文声称该公司已裁去数千名员工，剩下的合同工日常内容也仅为审阅 AI 生成的内容，从而保证翻译质量。

多邻国的 CEO 相当看好 AI，认为“AI 是伙伴而非敌人”，此前多邻国还推出了 Duolingo Max 订阅服务，该服务整合了 OpenAI 的 GPT-4 大语言模型，用户可以与 Duo（多邻国的吉祥物）等人物角色进行“对话式”聊天。

媒体报道：

IT之家：引入 AI 取代外包翻译工，消息称语言学习平台多邻国已裁员数千人

0 replies

ikaijua · 2024-01-06T05:54:06Z

ikaijua
Jan 6, 2024
Maintainer Author

2024-01-06 MyShell 开源OpenVoice，只需一句话就能模仿你的声音

OpenVoice 是一种实用性极强的即时仿声技术，只需要使用来自目标发言人的短音频，就可以模仿他们的声音，并以此生成各种语言的语音。

OpenVoice 不仅能够模仿参考发言人的音质，还可以精细控制包括情感、口音、语调、停顿和节奏在内的各种语音风格。除此之外，对于那些未在大规模发言人训练集中包含的语言，OpenVoice也可以实现“零样本”（Zero-shot）的跨语言模仿。

实测：目前对中文的支持不好，有电流音，情感的表现也不是很自然，要比elevenlabs的效果差。

论文：https://arxiv.org/pdf/2312.01479.pdf
项目：https://github.com/myshell-ai/OpenVoice

第三方

视频介绍和教程：OpenVoice测试：一句话实现声音克隆 | MyShell开源TTS

0 replies

ikaijua · 2024-01-06T06:04:49Z

ikaijua
Jan 6, 2024
Maintainer Author

2024-01-06 阿里开源DreamTalk项目，能根据音频让人物照片说话、唱歌，同时保持嘴型和表情与音频一致

DreamTalk能够生成高质量的动画，使人物脸部动作看起来非常真实。除了逼真的嘴唇动作，它还能展现丰富的表情，使动画更加生动。
DreamTalk支持多种语言，无论是中文、英文还是其他语言，都能很好地同步。
DreamTalk还具有说话风格预测的功能，能够根据语音预测说话者的风格，并同步表情，使得动画更加贴近原始音频。
该框架适用于多种场景，可以用于歌曲、不同类型的肖像，甚至在嘈杂环境中也能表现良好。

ssstwitter.com_1704274754586.mp4

Github地址：https://github.com/ali-vilab/dreamtalk
项目地址：https://dreamtalk-project.github.io/
论文地址：https://arxiv.org/abs/2312.09767

0 replies

ikaijua · 2024-01-06T07:12:55Z

ikaijua
Jan 6, 2024
Maintainer Author

2023-01-04 Meta AI发布音频生成3D人物技术audio2photoreal，可以生成全身逼真的虚拟人物形象

它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。
这些生成的虚拟人物不仅在视觉上很逼真，而且能够准确地反映出对话中的手势和表情细节，如指点、手腕抖动、耸肩、微笑、嘲笑等。

GitHub：https://github.com/facebookresearch/audio2photoreal/
项目及演示：https://people.eecs.berkeley.edu/~evonne_ng/projects/audio2photoreal/
Demo：https://colab.research.google.com/drive/1lnX3d-3T3LaO3nlN6R8s6pPvVNAk5mdK
论文：https://arxiv.org/pdf/2401.01885.pdf

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

AI新闻动态（2023-12-31到2024-01-06） #43

{{title}}

Replies: 9 comments

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{editor}}'s edit

{{editor}}'s edit

Select a reply

AI新闻动态（2023-12-31到2024-01-06） #43

ikaijua Jan 4, 2024 Maintainer

2024-01-04 阿里通义千问推出通义舞王功能，AI让全民热舞

Replies: 9 comments

ikaijua Jan 5, 2024 Maintainer Author

2024-01-05 斯坦福大学开源的家务机器人Mobile ALOHA，能烧菜、做家务，并提供了DIY教程

ikaijua Jan 5, 2024 Maintainer Author

2023-01-05 AI初创公司Perplexity AI在新一轮融资中获得总额7360万美元（约RMB5.28亿）

ikaijua Jan 5, 2024 Maintainer Author

2023-01-03 大型语言模型（LLM）对于curl项目的安全工作所带来的问题和困扰

ikaijua Jan 6, 2024 Maintainer Author

2024-01-05 美图AI视觉大模型MiracleVision（奇想智能）正式上线

ikaijua Jan 6, 2024 Maintainer Author

2024-01-05 科研期刊《Science》宣布引入 Proofig AI 检测图像欺诈，避免学术造假

ikaijua Jan 6, 2024 Maintainer Author

2024-01-05 引入 AI 取代外包翻译工，语言学习平台多邻国已裁员数千人

ikaijua Jan 6, 2024 Maintainer Author

2024-01-06 MyShell 开源OpenVoice，只需一句话就能模仿你的声音

ikaijua Jan 6, 2024 Maintainer Author

2024-01-06 阿里开源DreamTalk项目，能根据音频让人物照片说话、唱歌，同时保持嘴型和表情与音频一致

ikaijua Jan 6, 2024 Maintainer Author

2023-01-04 Meta AI发布音频生成3D人物技术audio2photoreal，可以生成全身逼真的虚拟人物形象

ikaijua
Jan 4, 2024
Maintainer

ikaijua
Jan 5, 2024
Maintainer Author

ikaijua
Jan 5, 2024
Maintainer Author

ikaijua
Jan 5, 2024
Maintainer Author

ikaijua
Jan 6, 2024
Maintainer Author

ikaijua
Jan 6, 2024
Maintainer Author

ikaijua
Jan 6, 2024
Maintainer Author

ikaijua
Jan 6, 2024
Maintainer Author

ikaijua
Jan 6, 2024
Maintainer Author

ikaijua
Jan 6, 2024
Maintainer Author