Cách chuyển đổi tài liệu Word sang HTML bằng C#

Bài đăng này sẽ chỉ cho bạn cách chuyển đổi Tài liệu Word sang HTML bằng C#. Chúng tôi sẽ tập trung vào việc phát triển hướng dẫn từng bước cùng với mã mẫu để tạo HTML từ DOCX bằng C#. Việc chuyển đổi tài liệu này sang định dạng HTML có thể được thực hiện mà không cần bất kỳ phần mềm bên thứ ba nào trên bất kỳ hệ điều hành nào, bao gồm MS Windows, Linux và macOS.

Các bước để chuyển đổi tài liệu Word sang HTML bằng C#

  1. Cài đặt GroupDocs.Conversion for .NET từ trình quản lý gói NuGet
  2. Thêm tham chiếu vào không gian tên GroupDocs.Conversion
  3. Tạo một thể hiện của lớp Converter và tải tệp Word nguồn
  4. Khởi tạo lớp MarkupConvertOptions để xác định thuộc tính cho tài liệu được chuyển đổi
  5. Gọi lớp Trình chuyển đổi Phương thức chuyển đổi, chuyển tên tệp đã chuyển đổi và thể hiện của lớp MarkupConvertOptions

Như bạn có thể thấy, quá trình phát triển khả năng chuyển đổi Word sang HTML C# khá đơn giản. Để bắt đầu, hãy tải xuống và cài đặt gói thích hợp từ NuGet, sau đó tham chiếu gói đó trong mã. Sau đó, để chuyển đổi tài liệu, hãy tạo một phiên bản của các lớp Trình chuyển đổi và MarkupConvertOptions và sử dụng phương thức Chuyển đổi.

Mã để chuyển đổi tài liệu Word sang HTML bằng C#

Chúng tôi đã viết một số mã mẫu để trình bày cách sử dụng tính năng C# DOCX sang HTML để chuyển đổi tài liệu. Chuyển đổi tài liệu cơ bản và tạo HTML từ tài liệu Word đã được giải quyết. Bạn cũng có thể sử dụng mã này để nâng cao các thuộc tính của tệp HTML đã chuyển đổi, chẳng hạn như danh sách chỉ mục trang, số trang, số trang bắt đầu, mức thu phóng, v.v.

Chúng tôi đã phát triển tính năng chuyển đổi Excel sang PDF trong C# trong bài viết trước của chúng tôi. Nếu bạn muốn tìm hiểu thêm về nó, bạn có thể đọc bài đăng trên cách chuyển đổi Excel sang PDF trong C#.

 Tiếng Việt