add audio doc #5299

SmileGoat · 2022-09-22T12:57:45Z

添加audio对应的api的中文说明

docs/api/paddle/audio/Overview_cn.rst

momozi1996 · 2022-09-23T03:01:00Z

docs/api/paddle/audio/Overview_cn.rst

+    :header: "API 名称", "API 功能"
+    :widths: 10, 30
+
+    " :ref:`LogMelSpectrogram<cn_api_paddle_audio_layers_LogMelSpectrogram>` ", "计算语音特征LogMelSpectrogram" 


这里的几个超链都失效了哈～

momozi1996 · 2022-09-23T03:02:56Z

docs/api/paddle/audio/features/LogMelSpectrogram_cn.rst

+.. py:class::paddle.audio.features.LogMelSpectrogram(sr=22050, n_fft=2048, hop_length=512, win_length=None, window='hann', power=2.0, center=True, pad_mode='reflect', n_mels=64, f_min=50.0, f_max=None, htk=False, norm='slaney', ref_value=1.0, amin=1e-10, top_db=None, dtype='float32')
+
+计算给定信号的log-mel谱.
+


老师，可以补充一个 “计算公式+公式参数说明：不？用户或读不懂怎么计算的。

建议不要加了，这是信号处理常用特征，直接看源码，比公式更加直接。

momozi1996 · 2022-09-23T03:06:49Z

docs/api/paddle/audio/features/LogMelSpectrogram_cn.rst

+
+LogMelSpectrogram
+-------------------------------
+


LogMelSpectrogram 有这么多参数，需要写明，以及源代码。
是class类的话，应该参考这么写：

总之，需要齐全。

部分是没有默认参数的，有默认参数已经添加，源代码链接不知道是什么回事。

docs/api/paddle/audio/features/LogMelSpectrogram_cn.rst

momozi1996 · 2022-09-23T03:17:00Z

docs/api/paddle/audio/features/MFCC_cn.rst

+-------------------------------
+
+.. py:class::paddle.audio.features.MFCC(sr=22050, n_mfcc=40, n_fft=2048, hop_length=512, win_length=None, window='hann', power=2.0, center=True, pad_mode='reflect', n_mels=64, f_min=50.0, f_max=None, htk=False, norm='slaney', ref_value=1.0, amin=1e-10, top_db=None, dtype='float32')
+


同样的问题，补充：

有公式，请补充公式。方便用户理解这个方法

docs/api/paddle/audio/features/MFCC_cn.rst

momozi1996 · 2022-09-23T03:20:41Z

docs/api/paddle/audio/functional/compute_fbank_matrix_cn.rst

+-------------------------------
+
+.. py:function::paddle.audio.functional.compute_fbank_matrix(sr, n_fft, n_mels=64, f_min=0.0, f_max=None, htk=False, nrom='slaney', dtype='float32')
+


functional 的写法：参考：

momozi1996 · 2022-09-23T03:20:50Z

docs/api/paddle/audio/functional/compute_fbank_matrix_cn.rst

+
+.. py:function::paddle.audio.functional.compute_fbank_matrix(sr, n_fft, n_mels=64, f_min=0.0, f_max=None, htk=False, nrom='slaney', dtype='float32')
+
+计算mel变换矩阵.


补个公式

momozi1996 · 2022-09-23T03:21:41Z

docs/api/paddle/audio/functional/compute_fbank_matrix_cn.rst

+代码示例
+:::::::::
+
+COPY-FROM: paddle.audio.functional.compute_fbank_matrix


同样是，示例代码块没找到。

momozi1996

老师，文档的问题是共性问题，需要在内容上统一修改一下，辛苦了！

文档的格式是没有问题的，目录也对。

momozi1996

LGTM

* add audio doc * fix typo * fix code link && punctuation * fix typo * fix features overivew link * add example * fix mfcc doc * add get_window * update code example * rm example * format * rm code example in cn

* add audio doc (#5299) * add audio doc * fix typo * fix code link && punctuation * fix typo * fix features overivew link * add example * fix mfcc doc * add get_window * update code example * rm example * format * rm code example in cn * update audio datasets && backend (#5363) * update audio datasets && backend * add overview * format * fix function info * rm seed in TESS * rename some api * fix load * fix return * fix codestyle * [audio] add general_gaussian, rm kaiser in get_window doc (#5378) * add general_gaussian in get_window doc * rm kaiser window * audio backends fix (#5445) * [audio] fix optional in audio doc (#5609) --------- Co-authored-by: Ligoml <39876205+Ligoml@users.noreply.github.com> --------- Co-authored-by: Ligoml <39876205+Ligoml@users.noreply.github.com>

SmileGoat added 2 commits September 22, 2022 20:40

add audio doc

9a75a1c

fix typo

b296fb4