作为开发人员喜爱的语言之一,Python以其丰富的社区可用工具和库而闻名。我们列出了开发人员可以用于计算机视觉10个流行流行的Python库或平台,以帮助开发人员自动化开发任务,其中包括检测和可视化。
1 | fastai
fastai是一个深度学习库,它提供高级组件,可以在标准深度学习领域快速、轻松地提供最先进的结果。它还为研究人员提供了可以混合和匹配的低层次组件,以建立新的方法。
fastai包括各种特性,比如一个gpu优化的计算机视觉库,它可以在纯Python中扩展,一个新的Python类型分派系统以及一个用于张量的语义类型层次结构等等。
链接:https://github.com/fastai/fastai
2 | IPSDK
IPSDK是一个用c++和Python编写的图像处理库。该库提供了一系列完整的图像处理功能来处理数据集,以及一个全面和优化的功能范围的2D和3D图像处理。
IPSDK自动调整自己以适应处理器的体系结构和能力。该库的功能包括全PC集群支持、高性能、高可用性计算等。
链接:https://www.reactivip.com/image-processing/
3 | Imutils
Imutils是一个计算机视觉软件包,包括一系列OpenCV +方便的功能,使基本的图像处理功能,如平移,旋转,调整大小,骨架化,显示Matplotlib图像,排序轮廓,检测边缘等相当容易。
链接:https://www.pyimagesearch.com/2015/02/02/just-open-sourced-personal-imutils-package-series-opencv-convenience-functions/
4 | Keras
Keras是用Python编写的高级神经网络库,能够运行在TensorFlow或Theano之上。该库的开发重点是实现快速实验。
这个深度学习库提供了几个特性,包括对卷积网络和循环网络的支持,允许简单和快速的原型化等等。
链接:https://keras.io
5 | Matplotlib
Matplotlib是一个全面的可视化库,用于用Python创建静态、动画和交互式可视化。该库可以执行各种功能,比如开发发布质量的图形、导出和嵌入到多种文件格式和交互环境中等等。
链接:https://matplotlib.org
6 | OpenCV
OpenCV是一个流行的、开源的计算机视觉库,专注于实时应用程序。该图书馆采用模块化结构,包括数百种计算机视觉算法。OpenCV包括图像处理、视频分析、二维特征框架、物体检测、摄像机标定、三维重建等模块。
链接:https://opencv.org
7 | Pytessarct
Pytessarct或Python-tesseract是Python语言的光学字符识别(OCR)工具。这个工具是谷歌的tesseracc – ocr引擎的包装器,可以帮助识别和读取嵌入在图像中的文本。
该工具还可以作为tesseract的独立调用脚本使用,可以读取Pillow和Leptonica图像库支持的所有图像类型,包括jpeg、png、gif、bmp、tiff等。
链接:https://pypi.org/project/pytesseract/
8 | PyTorchCV
PyTorchCV是一个基于pytorch的计算机视觉任务框架。该框架是一个集合的图像分类,分割,检测和姿态估计模型。在这个框架中有很多实现的模型,包括AlexNet, ResNet, ResNeXt, pyramid idnet, SparseNet, DRN-C/DRN-D等等。
链接:https://pypi.org/project/pytorchcv/
9 | Scikit-Image
Scikit-Image是一个流行的开源Python库,它包含了一组用于图像处理的算法。它基本上是一个SciPy的图像处理工具箱。建在scipy.n图像以Python语言提供一组通用的图像处理例程。这个图像处理库以Python编程语言提供了一个文档完善的API,并实现了用于研究、教育和工业应用的算法和实用程序。
链接:https://scikit-image.org
10 | SimpleCV
SimpleCV是一个流行的机器视觉框架,用于构建计算机视觉应用。这个库是用Python编写的,有助于访问几个高性能计算机视觉库,比如OpenCV。
该框架是可用于开发vision应用程序的库和软件的集合。它为相机、图像处理、特征提取和格式转换提供了简洁、可读的界面。它还允许用户使用来自网络摄像头、Kinect、FireWire和IP摄像头或移动电话的图像或视频流。
链接:http://simplecv.org