Monday, September 3, 2007

Có cần phải “ủng hộ ODF” để “chống lại OOXML”

Jason Matuscow đăng trên blog ngày 27/8 bài viết tiêu đề ODF / Open XML – Technical Specifications Mature Over Time đã lật lại một số sự kiện liên quan đến việc thông qua chuẩn ISO cho định dạng ODF:

8 trong số 32 nước thành viên P đã bỏ phiếu Yes with comments cho ODF. Một số các góp ý bao gồm:

  • Viện chuẩn Anh nêu ra một số vấn đề như việc phạm quy đối với quy trình ISO PAS và yêu cầu phải có biện pháp, tham chiếu phi chuẩn tới các đặc tả khác với các chuẩn ISO hiện hành, thiếu đặc tả nén, và những bất cập trong việc tham chiếu tới các đặc tả liên quan tới áp dụng (có nghĩa là các tính năng của Sun/OpenOffice). Không có cuộc họp giải quyết bình luận (BRM) diễn ra sau đó.
  • Ai Cập nhận xét rằng tại thời điểm đệ trình để thành chuẩn quốc tế ODF đã không có khả năng hỗ trợ các đặc tả ngôn ngữ Ả rập.
  • Nhật Bán nhận xét, nên chăng đặc tả nên bao gồm các khả năng kỹ thuật để hỗ trợ người tàn tật.
  • Trung Quốc nhận định ODF nên được tích hợp với bản dự thảo thứ nhất của chuẩn quốc gia Trung Quốc (UDF) và ODF không hỗ trợ các lược đồ do người dùng tự định nghĩa.

Chuẩn ODF không phải là một đặc tả cố định – ISO/IEC 26300 (ODF) không giống với đặc tả phiên bản mới nhất.

  • Tiểu ban kỹ thuật về Tài liệu mở của OASIS tiếp tục cải tiến các tính năng của ODF. Phiên bản ODF 1.1 đã ra đời và phiên bản 1.2 đang trong giai đoạn dự thảo. Đây là một minh chứng cho việc các công việc vẫn tiếp tục để bổ sung các tính năng chưa hoàn thiện hoặc thiếu sót trong phiên bản 1.0.
  • Hướng dẫn về PAS (JTC1N5746) chỉ ra rằng cần tránh những khác biệt nảy sinh với đặc tả của JTC1 trong các phiên bản tiếp theo. Do đó bản hướng dẫn yêu cầu các bên chủ thể của đặc tả cần làm việc chặt chẽ với JTC1 trong quá trình xem xét và sửa đổi các đệ trình của PAS. Phiên bản ODF 1.1 đã không được đệ trình lên JTC1, vậy chúng ta có nên hiểu rằng đặc tả đó chưa đủ hoàn thiện và nên chờ phiên bản 1.2? Và như vậy, câu hỏi mức độ hoàn thiển của đặc tả 1.0?
  • Tiểu ban kỹ thuật không những chỉ làm việc trên các đặc tả cốt lõi. Có tới 3 tổ chuyên môn chuyên trách các vấn đề về khả năng hỗ trợ người tàn tật, công thức, và metadata. Điều đó chứng tỏ khối lượng công việc cần phải thực hiện để hoàn thiện chuẩn ISO 26300.

Jason bình luận: “Quan điểm của tôi không phải là chỉ trích ODF không nên được thông qua chuẩn. Sự thực là Microsoft đã không cản trở việc đóng góp các đặc tả từ các đối thủ cạnh tranh – không những thế Microsoft còn bỏ phiếu đồng thuận để ISO/IEC ODF được ANSI chấp nhận và thông qua như chuẩn quốc gia. Dễ thấy rằng rất nhiều nỗ lực đã bỏ ra để phản đối một đặc tả ISO/IEC ngày hôm nay. Nói cách khác, khi ODF được đệ trình, trách nhiệm công dân đã không được đề cập đến một cách mạnh mẽ như hôm nay khi phản đối Open XML”

Jason viết tiếp “Vấn đề nằm ở chỗ không nên có những kẻ ném đá giấu tay. Các đặc tả sẽ hoàn thiện cùng với thời gian. Phép thử cho sự tồn tại của ISO/IEC DIS 29500 Open XML là đặc tả đó có được áp dụng bởi các nhà phát triển độc lập hay không? Câu trả lời đối với Open XML là điều không thể phủ nhận – . Những ứng dụng độc lập đặc tả Open XML dựa trên chuẩn hiện hành đã có và chạy trên các nền tảng Linux, Mac, Palm OS, iPhone và Windows. Các đồng nghiệp của tôi ở Đức vừa cho biết riêng Đức đã có có khoảng hơn 70 ứng dụng đặc tả này. Vậy vấn đề là mức độ hoàn thiện của một đặc tả có thể được minh chứng rằng nó có khả năng được áp dụng hay không.”

Một nhận xét thú vị khi đọc bài này là “Tây cũng có thành ngữ ném đá…” và cảm thấy vừa buồn cười vừa xấu hổ cho những người mượn danh cộng đồng mã nguồn mở để kêu gọi chống lại Open XML, khi đưa ra các luận điểm chẳng có ích lợi gì cho Việt Nam:

  • Ngay cả khi chưa hề tìm hiểu về khả năng hỗ trợ ngôn ngữ tiếng Việt trong ODF và thể hiện trong OpenOffice (tôi không thấy bản Sun Office 8 hỗ trợ ngôn ngữ tiếng Việt) họ đã lên tiếng chỉ trích (sau khi cóp nhặt trên Internet) những khiếm khuyết của OOXML trong việc hỗ trợ các ngôn ngữ khác như tiếng Trung Quốc và tiếng A râp. Một tình thần quốc tế cao cả chăng?
  • Thực sự họ đã làm gì cho ODF ở Việt Nam? Khi không hề có một buổi thảo luận, giới thiệu hay xây dựng ứng dụng trên ODF? Bạn hãy thử vào trang http://www.oss.gov.vn/tìm kiếm chữ ODF, kết quả là một số 0 tròn trĩnh.

Có ý kiến cho rằng “cộng đồng mã nguồn mở” không có đại diện http://dev.gentoo.org/~pclouds/blog/#2007-08-31T21_29_02. Tiếc thay, lại có những kẻ mượn danh để đục nước béo cò. Và họ không đủ khả năng để làm ứng dụng ODF ngoại trừ tuyên truyền cho OpenOffice dùng khuôn dạng ODF. Nếu bạn hỏi, có cần phải “ủng hộ ODF” để “chống lại OOXML” chưa chắc bạn đã nhận được câu trả lời.

4 comments:

Nguyễn Hoài Nam said...

Kính gửi Anh Cường,
Cho tôi gọi bằng Anh cho thân mật, Tôi lại mạn phép một lần nữa - xin anh thứ lỗi, Ở bài này tôi thấy mức độ hằn học của anh càng ngày càng tăng, nhất là ở phần cuối, thây không phù hợp với vị trí của anh.
Tôi thấy giới thiệu rất nhiều về ưu thế tương thích ngược của OOXML trước ODF. Thật sự tôi làm việc trong lĩnh vực điện tử, việc tương thích ngược có rất nhiều và luôn nhằm đáp ứng được thời điểm đó, nhưng thường để lại ý nghĩ tiêu cực về lâu dài (ví dụ truyền hình đen trắng - màu)- máy đen trắng phải xem được các chương trình màu và ngược lại và như vậy đẻ ra các chuẩn TV màu như NTSC, PAL, SEC phức tạp- tôi thấy vấn đề trong IT dễ hơn nhiều ví dụ như convert-utility - tương tự như convert TV box nhưng chi phí thì có thể cho không còn TV convert box ngày xưa có khi mắc hơn chính sản phẩm. Tất nhiên mọi so sánh đều khập khiễng.

Tôi cũng thấy anh hay sử dụng vị dụ cụ thể giữa MS office với Openoffice/startoffice để so sánh ODF và OOXML, ưu việt của OOXML. Đó chỉ là ứng dụng cụ thể có thể chưa đáp ứng hoàn toàn các yêu cầu của TC vì thế khi so sáng cũng là khập khiễng.
Và như tôi đọc được thì nếu OOXML có được chấp nhận thì cũng phải sửa đổi nhiều - không biết được khi đó MSO2007 có bao nhiêu điều không phù hợp với TC này.
Vì tôi góp ý bài này sau khi đã có hai bài sau nên đôi khi chuyện nọ sọ chuyện kia - mong anh thông cảm.

Bàn về hỗ trợ tiếng Việt cho các phần mềm.
Tôi nghĩ rằng MS hỗ trợ tiếng việt là đương nhiên. Một sản phẩm khi tiêu thụ đến một mwcs độ nào đó thì đều phải được chuyển sang ngôn ngư sở tại để dễ thâm nhập - như anh đi mua một TV màu, mobile - trước đây thì có đủ thứ tiếng ngoại trừ tiếng Việt còn nay thì tiếng Việt là đương nhiên -tôi không thây hãng NOKIA hay SONY kể công việc Việt hóa này - Nếu không việt hóa cho phần mềm của mình thì khả năng chiếm thị trường của phần mềm này sẽ kém rất nhiều - tôi nghĩ sản phẩm cú MS cũng vậy thôi.
Tôi cũng không biết ý nghĩa của hỗ trợ tiếng việt ở đây là những gì, Việt hóa - bảng mã (tổ hợp & dựng sẵn), chính tả, ngữ pháp, sắp xếp, chuyển đổi.
Tôi thử lấy một ví dụ nhỏ về mã dựng sẵn (TCVN 6909:2001)- hầu hết các dữ liệu tiếng Việt hiện nay đều sử dụng loại mã này - tôi không biết MSO 2007 đã đổi được giữa chữ thường chữ hoa và ngược lại chưa - MSO 2003 thì chưa.
Xin dừng bài - mỗi hôm một chút nếu thu xếp được thời gian.

Nguyen Kien Cuong said...

Xin cảm ơn về lời góp ý. Những nhận xét của tôi hoàn toàn là ý kiến cá nhân về vấn đề "tranh cãi" giữa chuẩn ODF và OOXML đôi khi vượt quá vấn đề kỹ thuật thuần túy, lan sang các vấn đề rộng hơn về chính sách công nghệ thông tin, hợp tác và đối đầu giữa phong trào phần mềm mã nguồn mở và phần mềm thương mại.

Dạo qua các blogs của 2 phe, có thể thấy sự cực đoan thể hiện rõ hơn ở phe chống OOXML, tuy không hẳn cần thiết phải ủng hộ ODF để chống OOXML.

Cá nhân tôi ủng hộ sự đa dạng, nhiều lựa chọn và tự do lựa chọn ít bị áp lực ảnh hưởng nhất.

Về vấn đề mã tiếng Việt, có lẽ không có thời gian để tra cứu và tranh luận, nhưng tôi chắc chắn một điều là các công ty phần mềm trên thế giới như Microsoft, IBM không ủng hộ bảng mã dựng sẵn. Quan điểm của cá nhân tôi, ngay từ thời các bảng mã còn đang tranh cãi là ủng hộ bảng mã tổ hợp. Một lý do đơn giản là ký tự double byte khi được định nghĩa, thì mỗi byte phải có ý nghĩa tương đương chứa đựng cho ký tự ghép - một byte dành cho ký tự không có dấu thanh, một byte dành cho ký tự dấu thanh, 2 byte tổ hợp lại thành một ký tự mới. Việc định nghĩa này sẽ đơn giản hóa được các thuật toán xử lý ký tự, sẽ được kế thừa trong các xử lý ngôn ngữ La Tinh, thể hiện trong các ứng dụng máy tính và phần mềm.

Trong khi đó nếu dùng bảng mã dựng sẵn, double byte chỉ còn mang ý nghĩa một số đếm để chỉ vị trí của ký tự trong bảng mã. Rất nhiều ký tự dựng sẵn của bảng mã Việt Nam đã vay mượn các ký tự đã sắp xếp cho các bảng mã La-Tinh có dấu khác, phải phát triển riêng mốt số thuật toán đển xử lý ký tự nếu sử dụng bảng mã dựng sẵn. Và do đó các thuật toán sẽ phải lựa chọn một cách chủ ý khi xử lý các đoạn văn theo bảng mã dựng sẵn, dùng lẫn các ký tự của các bảng mã ngôn ngữ khác

Một trong những lý do được nêu ra để bảng mã dựng sẵn trở thành TCVN 6909:2001 là các ký tự đựng sẵn được vẽ đẹp hơn :-)

Microsoft Office 2007 vẫn hỗ trợ bảng mã tiếng Việt tổ hợp (tôi đã thử chức năng đổi chữ hoa chữ thường) nhưng vẫn bó tay với chữ Việt theo bảng mã dựng sẵn, cũng như bó tay với rất nhiều bảng mã "cổ" của Việt Nam như ABC TCVN3, VNI...

Nguyễn Hoài Nam said...

Anh Cường thân mếm,
Tôi đưa ra bảng mã tổ hợp ở đây là có hai ý nghĩa.
Tương tự như ODF và OOXML mà thôi,
Nếu định dạng nào tốt thì ngay cả khi chưa thật tối ưu cũng được mọi người chấp nhận.
Trước đây tôi cũng đã thấy một trận bút chiến liên quan đến mã tổ hợp và mã dựng sẵn. Mặc dù được MS hậu thuận tốt hơn nhưng hiện nay sau một thời gian dài mã tổ hợp vẫn kém thông dụng hơn mã dựng sẵn.
Hơn nữa OOO hỗ trợ mã dựng sẵn cũng tương đối tốt, việc chuyển đổi rất mượt, anh có thể kiểm tra, tôi cũng đã thử sử dụng phần numbering trong OOO thì thấy, ngoại trừ chưa được lập trình cho số thứ tự dạng từ, việc sử dụng đối với các ngôn ngữ khác (kẻ cả trái qua phải và ngược lại) cũng rất tốt.
Tôi cũng chia sẻ với anh vì sự chậm chễ của MS trong cuộc chạy đua Tiêu chuẩn - nếu MS cởi mở hơn thì có thể nay đã rất khác, bởi vì như tôi đã nói ở trên, MS & ECMA còn phải chỉnh sửa DIS rất nhiều để có thể trở thành FDIS - nếu không thật nhiệt tâm thì tôi e sẽ lại trễ chuyến tàu ISO mất thôi.
Hôm nay tôi thấy blog của anh thể hiện mã tổ hợp rất tệ.

Còn về OSS và fan của OSS - hiện tôi cũng đang được biết MS đang xin giấy phép của OSI nhưng chưa được chấp nhận thì phải và hình như cũng đã có một trang web chuyên về mã nguồn mở của mình.

Chúc anh và MS kịp chuyến tàu cuối này.

Nguyen Kien Cuong said...

Chuẩn và ứng dụng chuẩn thực chất chỉ là 2 mặt của một vấn đề. Dùng nhiều thì thành chuẩn, hoặc chuẩn giúp ứng dụng được dùng nhiều hơn.

Nhưng đứng đằng sau ứng dụng lại là các nhà cung cấp với tham vọng và cơ hội tỉ tỉ đô-la. Chính vì thế khi đọc về cuộc tranh cãi ODF-OOXML thường rất hay gặp từ "consensus", nghĩa là "tỉnh táo". Nhưng giữ được sụ tỉnh táo cũng là điều rất khó trong muôn hình vạn trạng của thất tình lục dục - "hỉ nộ ái ố tham sân si".

Quan sát sự tranh cãi nảy lửa này, với sự tham gia của hơn 80 nước, còn nóng bỏng hơn tình hình khủng hoảng con tin Taliban Hàn Quốc, hay Bình Nhưỡng với vấn đề hạt nhân :)

Về chuẩn tiếng Việt, còn rất nhiều điều phải bàn cãi, chỉ có một nhận xét thú vị, khi so sánh kết quả tìm kiềm cụm từ "Thủ tướng Nguyễn Tấn Dũng" bằng 2 mã Unicode Tổ hợp và Unicode Dựng sẵn, thì kết quả của Tổ hợp (9,550) chỉ bằng chưa 1% kết quả của Dựng sẵn (1,250,000). Tiêu biểu cũng tổ hợp là BBC, VietNamNet. Dẫn đầu phe Dựng sẵn là VnExpress.Net và các website hút tin của nhau ở Việt Nam.

Cá nhân tôi vẫn đánh giá chuẩn TCVN 6909:2001 với bảng mã dựng sẵn là một chuẩn tồi, nhưng vẫn được phổ biến bởi trình ứng dụng bộ gõ với những ý chí non-IT.

Nói về việc IT hóa tiếng Việt, chúng ta đã từng kế thừa bảng mã ASCII 7 bit, rồi bảng mã 8 bit, nhưng giai đoạn đó diễn ra khá ngắn, nên ảnh hưởng chưa sâu rộng kể cả mặt tốt cũng như mặt xấu. Tôi còn nhớ có những trình ứng dụng bảng mã tiếng Việt 7 bit phải dùng cả các kí tự dưới 32̣. Cũng may là khi truyền trên mạng, những mã dưới 32 đã được dành cho điều khiển truyền thông, kết quả là không có chuyện Việt Nam hóa bảng mã ASCII.

Việc kế thừa bảng mã dựng sẵn, ban đầu do IBM và Microsoft đề nghị đã không diễn ra. Kết quả là IBM dừng các dự án hỗ trợ tiếng Việt cho hệ điều hành và ứng dụng. Còn Microsoft cũng tiến hành cầm chừng, khi các sản phẩm Windows và Office tiếng Việt không được sử dụng nhiều như mong đợi.

Về vấn đề hỗ trợ ngôn ngữ, tiếng Trung Quốc phức tạp hơn chúng ta nhiều, và họ đã thống nhất được cả hai kiểu là đơn giản và đây đủ, được các công ty phần mềm thế giới hỗ trợ.

Đành rằng Tiếng Trung nhiều người sử dụng hơn tiếng Việt, nhưng chính chúng ta đã nhỡ tàu khi không đồng thuận được vấn đề kế thừa bảng mã của các công ty phần mềm đề nghị.

Một lần nữa, xin cảm ơn anh Nam về những ý kiến đóng góp chân thành và thú vị.