Monday, March 30, 2009

2nd Document Freedom Day tại Hà Nội, 25 tháng 3 năm 2009

Ngày 25 Tháng 3 vừa qua, Hội Trường Trung tâm Tin học Pháp ngữ, ngày “Document Freedom Day” lần thứ 2 đã được tổ chức với sự tham gia của đông đảo các chuyên gia Công nghệ Thông tin đã và đang làm việc với các định dạng mở của văn bản (Open Document Formats), các cộng đồng phần mềm nguồn mở và các bạn sinh viên. Chương trình như sau:

  • Open Document format (ODF): định dạng tài liệu văn phòng
  • Kinh nghiệm chuyển đổi sang OpenOffice.org từ tỉnh Bắc Giang
  • Kế họach CNTT ngành giáo dục với PM Mã nguồn mở
  • LaTeX: định dạng tài liệu khoa học
  • Giới thiệu về Office Open XML
  • BibTeX: đinh dạng biểu ghi khoa học

Nhờ có sự giúp đỡ nhiệt tình, vô tư của anh Vũ Đỗ Quỳnh – Giám đốc Trung tâm Kỹ thuật Số thuộc Tổ chức Đại học Pháp ngữ tôi đã có cơ hội tiếp xúc với cộng đồng nguồn mở và ODF, trình bày một bài ngắn về Office Open XML (ISO/IEC 29500).

Sau bài trình bày, tôi nhận được khá nhiều câu hỏi từ anh Lê Trung Nghĩa và một số bạn hoạt động trong phong trào phần mềm nguồn mở. Đại ý các câu hỏi xoay quanh vấn đề tính tương thích của OOXML về việc đóng gói các định dạng nhị phân như hình ảnh, âm thanh, hoặc các khối macros trong tài liệu. Những câu hỏi này thực ra đã được đề cập đến khá nhiều lần khi chuẩn OOXML ECMA 376 còn đang được đệ trình để thông qua ISO. Thực chất vấn đề nêu ra không nằm trong tính khả thi về mặt kỹ thuật của việc đóng gói các mã nhị phân mà là những nghi ngại về tính mở của chuẩn OOXML khi cho phép xuất hiện các dữ liệu nhị phân (có thể mở hoặc không) bên trong một đặc tả phải được coi là mở hoàn toàn cho người áp dụng (implementors).

Còn nhớ những điều tôi đã đọc trên các blog về tranh cãi này trong suốt quá trình kiểm nghiệm và thông qua của ISO, các cuộc tranh luận không dứt giữa 2 phe ủng hộ OOXML và ủng hộ ODF, tôi đã trả lời vắn tắt rằng, việc đóng gói các đoạn mã nhị phân trong tài liệu không ảnh hưởng bản thân quá trình xây dựng chuẩn và duy trì nó bảo đảm tính mở công bằng cho các implementors, nhưng chuẩn mở đó không áp đặt quy ước thực hiện (render) đoạn dữ liệu nhị phân đó. Còn tính mở của chuẩn là điều không cần tranh cãi, do nó đã được ISO thông qua và bây giờ được ISO duy trì. Tất cả các nhà phát triển ứng dụng đều có thể tham khảo chuẩn này và xây dựng ứng dụng cho riêng nhu cầu của mình.

Không yên tâm lắm về câu trả lời của mình tôi đã tìm lại những blog về các tranh cãi đó và đã tìm ra  một blog rất hay Office Open XML hoaxes trong đó có một bài viết nhan đề OOXML Hoax 7: The binary blob. Nguyên văn như sau:

OOXMLHoax7

Thường thấy chuẩn OOXML hay bị tranh cãi rằng đó là một chuẩn XML cho phép chữa các thành phần nhị phân. Trước đây, định dạng XML của Office 2003 quả thực có gắn kèm các đoạn nhị phân trong tệp, do những đòi hỏi định dạng chỉ cho phép chứa tài liệu trong một tệp XML. Với OOXML đã có sự thay đổi lớn về các lưu trữ đoạn mã nhị phân đó, nó được đặt vào một file tách rời nhưng được đóng gói trong cùng một gói tin nén.

Do đó vấn đề dữ liệu nhị phần bên trong XML đã trở thành quá khử? Không, không hẳn thế, ban vẫn có thể tìm nó tại đây

http://docs.oasis-open.org/office/v1.1/OS/OpenDocument-v1.1.pdf

Vâng, ngay ở đoạn giữa của đặc tả Opendocument. Nó được gọi là thành phần office:binary-data. Đặc tả này tham chiếu đến dữ liệu nhị phân được mã hóa base64 bên trong tệp tin XML.

ODF cho phép chứa dữ liệu nhị phân bên trong tệp XML, sao không thấy ai nhắc đến?

image

Tuesday, March 24, 2009

A Quick Tour Of Open XML Formats

Check out this SlideShare Presentation:

Open XML Formats For CIO's

Check out this SlideShare Presentation: