今天盘点下9月份推荐的9个开源项目(点击标题查看详情)。
1、Pidgin:一个轻量级、快速且灵活的 C# 解析库
Pidgin是基于C#的开源项目,是一个解析组合器库,提供了一个高级别的声明性工具来构建解析器,使得编写解析器变得简单而直观。
1、轻量化与高效
Pidgin专注于提供轻量级的解决方案,旨在减少内存占用和提高解析速度。通过精心设计的数据结构和算法,Pidgin 能够在不牺牲功能的前提下实现高效的解析。
2、灵活性
Pidgin 支持解析各种复杂的数据格式,不仅限于文本数据。由于其能够处理任意类型的输入令牌(tokens),Pidgin 可以用于解析二进制协议、标记化输入等多种场景。
3、易于使用
与正则表达式相比,Pidgin 提供了更强大的解析能力,而与 ANTLR 等解析生成器相比,它又更简单易用。
Pidgin 的 API 设计直观,允许开发者以声明性的方式定义语法规则,而无需编写复杂的代码。
Star:896⭐
项目地址:https://github.com/benjamin-hodgson/Pidgin
2、Sep:一个低内存、高性能的CSV文件读写操作.Net开源库
Sep 是一个高性能的 .NET CSV 解析器,具备快速、现代、简洁且高效的数据处理能力。
**先进特性:**采用 .NET 7+ 和 C# 11+ 的先进特性,例如 Span、泛型数学接口(ISpanParsable/ISpanFormattable)、ref struct、ArrayPool 等,打造了一个现代且高效的实现方式。
**简洁API:**提供了一个简洁而富有表现力的 API,选项精简,对输入输出的处理透明无隐藏。你看到什么就得到什么。例如,它默认不会自动处理引号的转义/取消转义。
**极速性能:**通过架构特定和跨平台的 SIMD 矢量化解析技术,支持 64/128/256/512 位路径(如 AVX2、AVX-512(.NET 8.0+)、NEON),实现极速处理。利用 csFastFloat 快速解析浮点数。高效地逐行读取或写入数据,并有详尽的基准测试验证其性能。
**多线程加速:**通过高效的并行 CSV 解析技术,实现超快速度,比 CsvHelper 快达 35 倍。
**低内存占用:**智能高效的内存管理策略,在预热后实现零内存分配,包括轻松读取或写入值数组(如特征数据)而无需重复分配内存。
**全面测试保障:**拥有广泛的代码覆盖率,专注于边缘情况的测试,包括随机模糊测试,确保数据处理的准确性和稳定性。
**跨平台兼容:**支持 .NET 支持的所有平台和架构,100% 托管,采用现代 C# 编写,代码优美。
**可修剪且兼容 AOT/NativeAOT:**无反射或动态代码生成,确保完全可修剪且与提前编译(Ahead-of-Time)兼容。简单的控制台测试程序,可执行文件体积小,仅几 MB。
**实用主义:**遵循 RFC-4180 的核心原则,但在引用和行结束处理上采取实用主义方法。
Star:838⭐
**项目地址:**https://github.com/nietras/Sep
3、Atata:一个基于 Selenium的C#自动化测试Web框架
Atata Framework 是一个基于 Selenium WebDriver 的 C#/.NET Web UI 测试自动化全功能框架。
它使用流畅的页面对象模式;具有内置的日志记录系统;包含独特的触发器功能;具有一组即用型组件。
该框架的关键思想之一是为定义和使用页面对象提供简单直观的语法,页面对象实现需要尽可能少的代码。
而且描述一个页面对象类,无需任何方法,只需一组用属性标记的属性,这些属性就代表页面组件。
Star:490⭐
**项目地址:**https://github.com/atata-framework/atata
4、ChoETL:支持多数据库读写.Net开源库,包含 CSV、XML、JSON等8个格式
ChoETL 是一个开源的 .NET ETL(Extract, Transform, Load)框架。
它提供了解析和写入多种文件格式的能力,包括但不限于 CSV、FixedLength、XML、JSON、Key-Value、Parquet、YAML 和 Avro格式的文件、数据库。
Star:796⭐
**项目地址:**https://github.com/Cinchoo/ChoETL
5、HtmlSanitizer: 一个保护你的网站免受XSS攻击的.Net开源项目
HtmlSanitizer 是一个强大的库,它能够审查和清理 HTML 内容,移除或转义那些可能被用于 XSS 攻击的标签和属性。
这个工具的核心功能是提供一个安全的方式来处理用户提交的 HTML,确保这些内容在被渲染到网页上之前是无害的。
Star:1.6K⭐
**项目地址:**https://github.com/mganss/HtmlSanitizer
6、CSCore:一个.Net功能强大且灵活的开源音频处理库
CSCore是一个使用C#编写的音频库,它提供了丰富的功能,从播放和录制音频,到解码和编码音频流/文件,再到实时处理音频数据(如播放时应用自定义效果、创建可视化等)。
CSCore 基于一个非常可扩展的架构,这使得你可以毫不费力地使其满足你的需求。
支持的平台:仅限 Windows,Linux 和 Mac 为实验性支持。
Star:2.2K⭐
**项目地址:**https://github.com/filoe/cscore
7、Boxed:包含多个.Net项目模板,涵盖了ASP.NET Core API、GraphQL等。
.Net Boxed该项目为.NET开发者提供了一套包含基本代码的项目模板,涵盖了ASP.NET Core API、ASP.NET Core GraphQL、Microsoft Orleans以及NuGet Package的项目。
Star:3.4K⭐
**项目地址:**https://github.com/Dotnet-Boxed/Templates
8、Html2OpenXml:HTML转化为OpenXml的.Net库,轻松实现Html转为Word
Html2OpenXml 是一个开源.Net库,旨在将简单或复杂的HTML内容转换为OpenXml组件。
该项目始于2009年,最初是为了将用户评论转换为Word文档而设计的
随着时间的推移,Html2OpenXml 不断发展和完善,现在已经成为处理HTML到OpenXml转换的强大工具。
Star:313⭐
**项目地址:**https://github.com/onizet/html2openxml
9、tesseract:一个.Net版本的开源OCR项目
tesseract是针对Tesseract-OCR(C++)引擎封装的.NET版本,支持超过100种语言的文本识别,使得.NET开发者能够轻松地利用Tesseract的强大功能,无需深入了解OCR的底层技术。
此项目缺点是,只能识别印刷的文本,针对手写的需要自己训练语言包。
Star:2.3K⭐
**项目地址:**https://github.com/charlesw/tesseract
- End -
更多开源项目: https://github.com/bianchenglequ/NetCodeTop