feat: 🎸 Added the model dtype parameter for embedding (currently only supported for models gte-Qwen2). #2120

Zzzz1111 · 2024-08-20T01:56:24Z

✅ Closes: #2076

新增嵌入模型dtype参数(目前只支持模型gte-Qwen2,需要模型支持，gte-Qwen2是支持fp16和fp32推理)

✅ Closes: xorbitsai#2076

qinxuye

Thanks, I left some comments.

xinference/model/embedding/core.py

qinxuye · 2024-08-22T04:31:04Z

Please fix the lint, https://github.com/xorbitsai/inference/actions/runs/10501257334/job/29090999920?pr=2120

You can use black to format your code.

✅ Closes: xorbitsai#2120

Zzzz1111 · 2024-08-22T07:41:42Z

format it

qinxuye

LGTM

feat: 🎸 新增嵌入模型dtype参数(目前只支持模型gte-Qwen2)

27f12d4

✅ Closes: xorbitsai#2076

XprobeBot added the feature label Aug 20, 2024

XprobeBot added this to the v0.14 milestone Aug 20, 2024

qinxuye reviewed Aug 20, 2024

View reviewed changes

xinference/model/embedding/core.py Outdated Show resolved Hide resolved

xinference/model/embedding/core.py Show resolved Hide resolved

xinference/model/embedding/core.py Outdated Show resolved Hide resolved

qinxuye changed the title ~~feat: 🎸 新增嵌入模型dtype参数(目前只支持模型gte-Qwen2)~~ feat: 🎸 Added the model dtype parameter for embedding (currently only supported for models gte-Qwen2). Aug 20, 2024

zzzz199605 added 2 commits August 20, 2024 18:28

refactor: 💡 修改参数名和torch_dtype默认值

4319cd5

refactor: 💡 支持bf16

d054dbc

qinxuye reviewed Aug 22, 2024

View reviewed changes

xinference/model/embedding/core.py Outdated Show resolved Hide resolved

fix: 🐛 改即有异常又抛出异常

a35983b

refactor: 💡 format code

504325b

✅ Closes: xorbitsai#2120

qinxuye approved these changes Aug 23, 2024

View reviewed changes

qinxuye merged commit c6a58ba into xorbitsai:main Aug 23, 2024
11 of 13 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: 🎸 Added the model dtype parameter for embedding (currently only supported for models gte-Qwen2). #2120

feat: 🎸 Added the model dtype parameter for embedding (currently only supported for models gte-Qwen2). #2120

Zzzz1111 commented Aug 20, 2024

qinxuye left a comment

qinxuye commented Aug 22, 2024

Zzzz1111 commented Aug 22, 2024

qinxuye left a comment

feat: 🎸 Added the model dtype parameter for embedding (currently only supported for models gte-Qwen2). #2120

feat: 🎸 Added the model dtype parameter for embedding (currently only supported for models gte-Qwen2). #2120

Conversation

Zzzz1111 commented Aug 20, 2024

qinxuye left a comment

Choose a reason for hiding this comment

qinxuye commented Aug 22, 2024

Zzzz1111 commented Aug 22, 2024

qinxuye left a comment

Choose a reason for hiding this comment