推荐一个开源库,轻松实现HTML转化为OpenXml。
01 项目简介
Html2OpenXml 是一个开源.Net库,旨在将简单或复杂的HTML内容转换为OpenXml组件。
该项目始于2009年,最初是为了将用户评论转换为Word文档而设计的
随着时间的推移,Html2OpenXml 不断发展和完善,现在已经成为处理HTML到OpenXml转换的强大工具。
02 项目核心功能
**HTML转OpenXml:**该库能够将HTML文档(包括简单的文本、图像、表格等)转换为OpenXml格式的组件,进而可以被Microsoft Word等应用程序识别和处理。
**.Net支持版本:**Html2OpenXml 支持.Net Framework 4.6.2、.NET Standard 2.0 和 .NET 8,确保了在不同.Net环境下的兼容性。
**依赖:**该库依赖于DocumentFormat.OpenXml和AngleSharp这两个包,分别用于处理OpenXml文档和HTML解析。
03 支持Html标签
常规标签:如<a>, <h1>-<h6>, <b>, <i>, <u>, <s>, <del>, <ins>, <em>, <strike>, <strong>等。
图像和图表:<img>, <figcaption>, <svg>。
表格相关:<table>, <td>, <tr>, <th>, <tbody>, <thead>, <tfoot>, <caption>, <col>。
其他常用标签:如<div>, <span>, <p>, <ul>, <ol>, <li>, <q>, <blockquote>, <article>, <aside>, <section>等。
需要注意的是,标签的样式属性style是支持的,但JavaScript (<script>), CSS样式(<style>), <meta>标签、注释、按钮和输入控件等HTML元素在转换过程中会被忽略。
04 使用示例
该项目有着详细的开发文档,并且项目中也提供示例。
开发文档:
https://github.com/onizet/html2openxml/wiki
Html转为Word示例截图
Html代码
转换后的Word截图
从截图可以看出Html标签、样式等都可以正常转换过来。
05 项目地址
https://github.com/onizet/html2openxml
- End -
更多开源项目: https://github.com/bianchenglequ/NetCodeTop
我是编程乐趣,一个.Net开发经验老程序员,欢迎“关注”我,每天为你分享开源项目和编程知识。
也欢迎加入【.Net技术编程交流社区】,和大家共同学习交流!,点击加入:https://bbs.csdn.net/topics/613465368
推荐阅读
2个零基础入门框架教程!
一个C#开源工具库,集成了超过1000个扩展方法
Sep:一个低内存、高性能的CSV文件读写操作.Net开源库
Boxed:包含多个.Net项目模板,涵盖了ASP.NET Core API、GraphQL等。
Atata:一个基于 Selenium的C#自动化测试Web框架