Monday, September 3, 2007

Tiếng Việt trong Open XML

Một vài khiếm khuyết của đặc tả Open XML trong hỗ trợ các ngôn ngữ địa phương khác nhau như tiếng Ả Rập, tiếng Trung v.v... thường hay được sử dụng làm cứ liệu cho lập luận Open XML không đếm xỉa đến các ngôn ngữ khác ngoài tiếng Anh.

Khi đi tìm một ví dụ sử dụng đa ngôn ngữ trong Open XML, tôi bắt gặp trang blog của Doug Mahugh có tiêu đề Open XML Numbering Options đã đề cập đến vấn đề này qua các ví dụ bằng tiếng Nga, tiếng Ả Rập, Hindi, Do Thái, Nhật Bản, Thái Lan và tiếng Việt. Doug còn sử dụng tiếng Việt trong đoạn giải thích về trật tự các số đếm trong lựa chọn đánh số văn bản (Numbering Options), có lẽ vì tiếng Việt thể hiện bằng ký tự La-Tinh nên dễ đọc hơn?

Trong mỗi kiểu danh sách (được chụp lại từ màn hình Word), tôi (Doug Mahugh) chỉ thay đổi một giá trị của thẻ đánh dấu XML: numFmt. Kết quả là các danh sách động sẽ hành xử đúng như người dùng mong muốn. Ví dụ một người Việt nam có thể chèn thêm một mục trước mục hai (2) trong danh sách được đặt khuôn dạng vietnameseCounting, và mục mới thêm vào sẽ được đánh dấu là hai (2), mục hiện thời sẽ mang giá trị ba (3), và cứ thế tiếp tục.

Hoặc là, bạn có thể làm với các định dạng khác bằng cách chèn trực tiếp các tiếp tố được mã cứng. Nhưng khi đó bạn sẽ phải tái tạo lại các tiếp tố mỗi khi thêm hoặc bớt các chỉ mục trong danh sách. Với Open XML, bạn chỉ cần chỉ ra rằng đó là danh sách kiểu vietnameseCounting, và các giá trị sẽ được đánh số thứ tự bằng tiếng Việt.

Tôi đã thử làm điều này với Sun Office 8, nhưng không được, có lẽ vì giao tiếp của Sun Office 8 không cho phép tôi lựa chọn ngôn ngữ tiếng Việt?

2 comments:

Nguyễn Hoài Nam said...

Tôi viếng blog này cũng chưa lâu và rất tiếc một blog được dựng công phu này mà không thấy ai hưởng ứng cả - no comment thì tiếc thật - đành phải làm gà què bới linh tinh vậy.
Trước hết do không rõ chủ nhân của blog này là ai - nhưng chỉ do mỗi "Nguyen Kien Cuong" viết thôi nên tôi thử tìm hiều chủ nhân của blogger này là ai - tôi tìm kết hợp "Nguyen Kien Cuong" OOXML và microsoft thì được 3 kết quả và chỉ tới một ông Nguyễn Kiên Cường "Giám đốc phát triển cộng đồng công nghệ Microsoft Việt Nam" - với blog này rất công phu nên tôi lại càng phải nghĩ rằng blog này do ông Cường và ekip của ông ta tạo ra. Nếu tôi có nghỉ việc và không là gig cả chỉ nghiên cứu OOXML và ODF thôi thì cũng khó mà tạo ra blog này được.
Theo tôi blog này là một tiếng nói của MS về OOXML.
Bàn về TC
1. Trước hết tôi không chống lại các tiêu chuẩn do công ty làm ra kể cả ISO, IEC
Tôi là mội người cũng thường xuyên phải sử dụng Tiêu chuẩn TCVN, ISO, IEC, GOST, BS, DIN ...) trong đó có rất nhiều TC do các công ty, hiệp hội tạo ra - hầu hết các tiêu chuẩn về IT đều do các công ty và các hiệp hội biên soạn trước sau đo phổ biến và trở thành một TC quốc tế.
Tuy nhiên ở góc độ người dùng - lần đầu tiên tôi thấy một tiêu chuẩn đồ sộ như thế này - thật sự choáng ngợp trước DIS 29500 - có lẽ sẽ đạt GUINESS về độ lớn một tiêu chuẩn - 6000 trang. Trong thời đại bản quyền và sở hữu trí tuệ - thì để có được bản TC này (nếu bạn, công ty bạn đang phát triển một ứng dụng trên cơ sở OOXML thì bạn phải có TC này) bạn sẽ phải chi hơi bị nhiều tiền đấy - pho to trộm với giá 250 đ/trang cũng phải chi 1,5 triệu đồng rồi, còn mua ISO - bạn sẽ phải chi khoảng 0,5 CHF/trang (khoảng 13000 đ/trang)vậy là khoảng 40 triệu cho TC này ;-) có thể trong tương lai MS sẽ tặng bạn TC này khi bạn cần!!?? - và lần đầu tiên tôi cũng download công khai DIS này trên mạng 5 phần khoảng 40M.
2. Về nội dung tôi cũng đọc các bài liên quan trên một site khác " say no to OOXML" - http://www.noooxml.org/not-for-orient
ở đây cũng có nhiều bài nói về ooxml nhưng với chiều ngược lại -
là người VN không chuyên trong lĩnh vực IT và cũng không có thời gian để đọc DIS 29500 nên tôi muốn MS làm rõ các nội dung như trong site nêu trên để mọi người hiểu rõ vì một số sẽ liên quan trực tiếp đến tiếng việt hay các ngôn ngữ dân tộc khác, chữ cổ của Vietn nam. Một hay hai TC trong cùng một lĩnh vực cũng không thực sự quan trọng miễn là nó tốt và phù hợp với yêu cầu của số đông , như đã nối ở 1. rất nhiều tiêu chuẩn quốc tế được hình thành từ các tc của công ty, hiệp hội và sau quá trình sử dụng, các công ty khác tháy hay và đần dần chuyển thành TC quốc tế - các TC quốc tế không bắt buộc phải áp dụng. Ở đây, tôi chỉ sợ rằng - có thể MS chỉ cần ISO công nhận TC của họ là ISO là đủ -sau đó sẽ dùng tiềm năng tài chính để áp đặt - và luôn nói dữ liệu của tôi tuân thủ theo TC ISO đấy nhé - giống như các công ty VN quảng cáo sản phẩm của tôi sản suất theo ISO9000 vậy.
3. Tôi đã chọn Không đối với DIS này vì lí do trên.
Có thể bài này không được đăng

Nguyen Kien Cuong said...

Cảm ơn bạn Nam đã ghé thăm trang blog và để lại bình luận.

Cũng như nhiều đồng nghiệp khác của tôi sử dụng kênh blog để cung cấp cho cộng đồng người sử dụng Internet các quan điểm cá nhân về công nghệ, những chi tiết mà đôi khi kênh chính thức của công ty không nêu ra.

Nếu ai đó khuyên Microsoft cách đây khoảng 10 năm phải mở định dạng dữ liệu thì chắc chắn sẽ bị cho là điên rồ hoặc đang rắp tâm chống lại Microsoft. Các đặc tả công nghệ của Microsoft đưa ra hầu hết được tiếp nhận một cách "tự nhiên": như FAT, FAT32, NTFS, DirectX, Binary Office Documents.

Nhưng ngày nay, câu chuyện đã khác, khi mô hình tính toán và doanh nghiệp dựa trên nền tảng thông tin kết nối toàn cầu, vấn đề tính tương hợp trở thành chìa khóa thành công trong việc xây dựng các sản phẩm CNTT phục vụ người dùng. Tính tương hợp chỉ có thể được bảo đảm khi tất cả các bên thống nhất sử dụng cùng một (hoặc một số) chuẩn.

Với đông đảo người dùng, Microsoft Office vẫn tiếp tục ra những phiên bản tiếp theo và sự thực khuôn dạng dữ liệu (có ISO hay không) không ảnh hưởng nhiều đến doanh số bán cũng như số người sử dụng. Cùng với thời gian, số người sử dụng Office 2007 và các phiên bản tiếp theo sẽ tăng dần, và theo đó là số lượng các tệp theo định dạng OOXML. Có lẽ câu marketing "hãy dùng sản phẩm abc xyz, vì định dạng của nó là ISO" không có sức thuyết phục. Bằng chứng là số người sử dụng OpenOffice tăng trưởng rất chậm chạp, dù là miễn phí và định dạng của file là ODF theo ISO.

Về vấn đề hỗ trợ các ngôn ngữ địa phương, có thể khẳng định chắc chắn rằng OOXML làm tốt hơn ODF, vì sản phẩm Office 2007 đã kế thừa các thành tích Việt hóa các phiên bản Office trước đây, điều mà OpenOffice còn lâu mới đạt tới. Thêm vào đó Open XML cho phép người sử dụng kế thừa và tự định nghĩa các bộ lược đồ (XML User Defined Schemas) mà ODF không có tính năng đó.

Sự phức tạp và đồ sộ của đặc tả Open XML xuất phát từ mục tiêu đáp ứng ở mức độ cao nhất các tính năng của bộ phần mềm Office. Điều đó cũng đúng với ODF khi ODF được ra đời chủ yếu để đáp ứng các tính năng của OpenOffice. Khác với OpenOffice và ODF, Microsoft Office và Open XML phải đạt được mục đích tương thích ngược với các văn bản đã được tạo ra trong quá khứ.

Thế giới sẽ thật hoàn hảo khi Microsoft đầu tư vào ODF hoặc sẽ tuyệt vời hơn nữa, nếu Microsoft đầu tư phát triển hệ điều hành Linux. Nhưng đó chỉ là giấc mơ giữa ban ngày.

Thế giới vốn rất phong phú các điển hình của sự cạnh tranh, hợp tác, tranh cãi, thỏa thuận... Nhưng không phải theo cái cách mà những người chống OOXML hiện nay đang làm là ra sức ngụy biện để cản trở sáng tạo, sự đa dạng thậm chí sẵn sàng hy sinh lợi ích của một số lượng rất đông người dùng.

Đọc đến đây chắn hẳn phe chống OOXML sẽ nói rằng "số lượng rất đông người dùng" đó là những kẻ mê muội, bị lừa đảo, bị áp bức, bắt buộc phải dùng sản phẩm của Microsoft v.v... và sứ mạng của họ là đem lại sự công bằng, tự do, giác ngộ...

Thời gian và công sức họ bỏ ra có lẽ tốt hơn nên để phát triển hoặc đào tạo ứng dụng trên ODF.