Skip to content

Latest commit

 

History

History
153 lines (100 loc) · 6.71 KB

9-pyhubweekly.md

File metadata and controls

153 lines (100 loc) · 6.71 KB

前言

PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。

如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~

本期为大家推荐GitHub上5个优质的Python项目,它们分别是:

  • pre-commit
  • beets
  • Picard
  • pydantic
  • airflow

下面分别来介绍一下上述5个GitHub项目。

pre-commit

Star:4k

代码规范检查是项目上线过程中必不可少的一环,在大多数情况下,我们都是把代码提交到代码库再进行静态检查。但是,为什么不从最源头把这个问题解决呢?

pre-commit是一款由Python开发的git hooks工具,它能够在合入代码,提交commit时对代码进行规范检查和格式化,这样就能够从根源上解决代码规范的问题,而不是把代码合入到代码库中再统一解决,这样不仅耗时,而且繁琐。

我们下面以Python项目中使用为例进行介绍,但是,它不仅适用于Python,它能够适用于所有编程语言

安装

pip install pre-commit

配置文件

安装之后需要修改一下配置文件,.pre-commit-config.yaml

repos:
-   repo: https://github.com/pre-commit/pre-commit-hooks
    rev: v2.3.0
    hooks:
    -   id: check-yaml
    -   id: end-of-file-fixer
    -   id: trailing-whitespace
-   repo: https://github.com/psf/black
    rev: 19.3b0
    hooks:
    -   id: black

使用

pre-commit install
git commit -m "Add super awesome feature"

提交commit之后就可以看到,它会用到两个工具blackflake8。black我在第七期介绍过这款工具,它是一款高效的代码格式化工具,用于修改代码格式。flake8是一款格式检查工具。

beets

Star:9.2k

beets是一款音乐收藏辅助工具,它能够让音乐收藏一劳永逸。它会对你的集合进行分类,并在此过程中自动增强其元数据。然后,它通过提供的一组工具来操作和访问你的音乐。

安装

pip install beets

具体使用教程可以查看文档

Picard

Star:2k

Picard是一款由Python开发的跨平台音乐标记工具,它能够在Linux/Mac OS X/Windows多个平台上进行使用。

Picard支持大多数音频文件格式,能够使用音频AcoustIDs,执行CD查找和磁盘ID提交,并且具有出色的Unicode支持。

pydantic

Star:2.5k

使用过Python的应该都很清楚,Python是一种对数据类型非常弱化的一种编程语言。在编写Python程序时,你不需要去关心数据的类型。但是,这对于阅读代码和调试代码却带来了很多麻烦,因此,我们还是需要养成C++/Java那样的好习惯,应该关注数据类型。

pydantic是一款使用Python类型提示对Python项目进行数据验证和设置管理的工具。

安装

pip install -U pydantic

示例

from datetime import datetime
from typing import List, Optional
from pydantic import BaseModel

class User(BaseModel):
    id: int
    name = 'John Doe'
    signup_ts: Optional[datetime] = None
    friends: List[int] = []

external_data = {'id': '123', 'signup_ts': '2017-06-01 12:22', 'friends': [1, '2', b'3']}
user = User(**external_data)
print(user)
#> User id=123 name='John Doe' signup_ts=datetime.datetime(2017, 6, 1, 12, 22) friends=[1, 2, 3]
print(user.id)
#> 123

通过上述示例我们可以看出,通过继承pydantic中的BaseModel,能够对传入的参数进行数据类型的校验和修正,这样能够避免开发过程中难以定位的问题。

airflow

Star:16k

airflow一个通过编程方式编写、调度和监视工作流的平台。

为什么调度、监视工作流的方式有很多,却偏偏选择airflow呢?

因为,当工作流被定义为代码时,它们变得更加可维护、版本化、可测试性和协作性,通过定义airflow有向无环图工作流可以实现如下优点,

  • 动态
  • 可扩展
  • 简洁清晰


推荐阅读


欢迎关注我的公众号“平凡而诗意”,原创技术文章第一时间推送,如果喜欢,麻烦点一下“在看”~