diff --git a/apib/harf.apib b/apib/harf.apib index f87d0e1..5a2754f 100644 --- a/apib/harf.apib +++ b/apib/harf.apib @@ -110,7 +110,7 @@ HOST: https://harf.roshan-ai.ir + Response 200 (application/json) [ { - "media_url": "https://i.ganjoor.net/a2/41417.mp3", + "media_url": "http://harf.roshan-ai.ir/.../...-41417.mp3", "duration": "0:00:44", "segments": [ { @@ -380,7 +380,7 @@ HOST: https://harf.roshan-ai.ir {"state":"PENDING"} ## تأیید هویت گوینده [/api/speaker_tasks/verification/] -هویت گوینده صدا را ارزیابی می‌کند. یک فایل صوتی و تعدادی نمونه‌صدا از یک شخص را دریافت می‌کند و بعد بررسی می‌کد که آیا گوینده فایل صوتی همان گوینده نمونه‌صداهاست یا نه. میزان شباهت را هم با عددی بین ۰ و ۱ مشخص می‌کند. +هویت گوینده صدا را ارزیابی می‌کند. یک فایل صوتی و تعدادی نمونه‌صدا از یک شخص را دریافت می‌کند و بعد بررسی می‌کند گوینده فایل صوتی تا چه میزان مشابه گوینده‌ای است که نمونه‌صداهایش را داده‌ایم. میزان شباهت با عددی بین منهای یک تا مثبت یک مشخص می‌شود. اگر بیشتر از `0.65` باشد، مقدار فیلد `result` برابر `Verified` و اگر نه `Rejected` خواهد بود. شما می‌توانید این مقدار را نادیده بگیرید و با توجه به میزان مشابهت در فیلد `similarity`، از آستانه دلخواه خودتان استفاده کنید. ### مثال [POST] + Request (application/json) @@ -404,7 +404,7 @@ HOST: https://harf.roshan-ai.ir ] ## شناسایی هویت گوینده [/api/speaker_tasks/identification/] -هویت گوینده را شناسایی می‌کند. یک فایل صوتی و تعدادی نمونه‌صدا از اشخاص مختلف می‌گیرد و بعد تعیین می‌کند کدام شخص، محتمل‌ترین گوینده فایل صوتی است. میزان شباهت را هم با عددی بین ۰ و ۱ مشخص می‌کند. +هویت گوینده را شناسایی می‌کند. یک فایل صوتی و تعدادی نمونه‌صدا از اشخاص مختلف می‌گیرد و بعد تعیین می‌کند کدام شخص، محتمل‌ترین گوینده فایل صوتی است. میزان شباهت با عددی بین منهای یک و مثبت یک مشخص می‌شود. اگر بیشتر از `0.65` باشد، مقدار فیلد `result` برابر `Identified` و اگر نه `Unknown` خواهد بود. شما می‌توانید این مقدار را نادیده بگیرید و با توجه به میزان مشابهت در فیلد `similarity`، از آستانه دلخواه خودتان استفاده کنید. ### مثال [POST] + Request (application/json)