Friday, August 10, 2007

Tại sao chúng ta quan tâm tới định dạng văn bản?

Văn bản (trên giấy hoặc dưới dạng điện tử) là phương tiện trao đổi thông tin chủ yếu giữa con người với con người. Định dạng văn bản đóng một vai trò quan trọng trong việc giúp người sử dụng máy tính chia sẻ thông tin. Chắc hẳn rất nhiều người sử dụng máy tính vẫn còn nhớ thời kỳ khi mà các máy tính sử dụng Microsoft® Windows® không thể chia sẻ thông tin với máy tính sử dụng Macintosh®. Nhờ có sự cộng tác kỹ thuật, vấn đề này cuối cùng đã được xử lý, giúp cho việc trao đổi thông tin giữa các nền tảng công nghệ thông tin được dễ dàng hơn. , Đây là một bước tiến to lớn và rất đáng kinh ngạc đối với những người giao thiệp với cả người sử dụng Windows lẫn Macintosh.

Khả năng kết nối thông tin của chúng ta sẽ được cải thiện khi định dạng văn bản được chia sẻ giữa các ứng dụng và nền tảng. Những định dạng văn bản như PDF, .DOC, .TXT và rất nhiều dạng khác đã trở thành chuẩn phổ biến nhờ tính được sử dụng rất rộng rãi (de facto). Giống như định dạng HTML, những định dạng văn bản này là phương cách trao đổi thông tin rất phù hợp vì trong phần lớn các trường hợp, người gửi có thể tin rằng người nhận sẽ mở hoặc đọc được những tài liệu được gửi đi.

Đối với phần lớn người sử dụng, định dạng văn bản không đóng vai trò gì quan trọng; họ hầu như không quan tâm định dạng nào đang được sử dụng, miễn là họ có thể mở, đọc, và làm việc với văn bản mà không bị gián đoạn. Và thường thường, người sử dụng sẽ rút ra một kết luận: “Tôi không mấy khi gặp sự cố gì khi mở các văn bản mà người khác gửi cho tôi, nên đối với tôi đây không là vấn đề gì. Vậy, tại sao tôi lại phải quan tâm?”

Gần đây đã có rất nhiều cuộc hội thảo xoay quanh vấn đề làm sao có thể đạt được một tiêu chuẩn về định dạng văn bản có thể tồn tại vững bền trong thế giới phần mềm đầy biến đổi mà chúng ta đang sống. Nhìn từ bên ngoài, cuộc thảo luận này có thể khá rắc rối và dễ gây tranh luận, vì có rất nhiều ý kiến khác nhau xoay quanh vấn đề tiêu chuẩn hóa định dạng văn bản. Có điều thú vị là nhiều vị khách đến dự hội thảo với cùng một mục đích chung là giúp cho quá trình trao đổi thông tin dễ dàng hơn. Thế nhưng, chúng ta thấy để thu được một cách nhìn rõ ràng trong cuộc tranh luận này không hề dễ dàng gì. Những ý kiến trái ngược nhau về tiêu chuẩn định dạng văn bản đã trở thành một tranh luận rất cần thiết về các vấn đề của việc định dạng văn bản được tiêu chuẩn hóa sẽ có những chức năng gì, ai nên nắm quyền thiết kế, và ai có quyền sử dụng những định dạng này.

Hiện đang có rất nhiều nỗ lực nhằm đáp ứng nhu cầu chung về các định dạng văn bản phổ biến và các quan điểm, hướng giải quyết cho những thách thức này cũng khá đa dạng. Các định dạng Open XML, UOF, PDF, ODF, RTF, TXT, ASCII, HTML và nhiều định dạng khác đưa ra các giải pháp khác nhau. Thị trường chưa quyết định ai sẽ là người “chiến thắng”. Và có lẽ, câu trả lời hợp lý nhất cho câu hỏi về định dạng văn bản này là, sẽ không có một người chiến thắng duy nhất. Rất nhiều định dạng văn bản đang được sử dụng ngày nay có các sứ mạng hoàn thành các nhiệm vụ cụ thể khác nhau. Việc cố ép chúng thành một định dạng duy nhất sẽ không phải là giải pháp tối ưu.

Cân bằng giữa thực tế và quyền lợi lâu dài

Nhiều mục tiêu khác nhau đã được đem ra làm định hướng cho cuộc thảo luận về tiêu chuẩn hóa định dạng văn bản. Chúng ta cần thêm nhiều nỗ lực để phân loại những vấn đề quan trọng này, nhằm hiểu rõ độ ảnh hưởng của chúng đến định dạng văn bản và chúng ta có thể làm được những gì. Một vài mục tiêu bao gồm:

  • Sự tự do lựa chọn định dạng phù hợp với nhu cầu của công việc.
  • Định dạng văn bản có thể dễ dàng được trao đổi giữa các ứng dụng và hệ thống.
  • Sự tự do không phụ thuộc vào bất kỳ một ứng dụng, bên trung gian, hoặc nền tảng nhất định nào để trao đổi dữ liệu.
  • Tính tương thích tối đa với bất kỳ văn bản hiện thời nào.
  • Giữ gìn văn bản cho quá trinh quản lý dữ liệu và lưu trữ.
  • Định dạng văn bản hỗ trợ quy mô của ngôn ngữ và các nhu cầu đòi hỏi kỹ thuật.
  • Giải thích cho sự đa dạng, phong phú của các ứng dụng, sử dụng và chức năng của phần mềm.
  • Bảo vệ thông tin được lưu trữ trong văn bản tránh bị sử dụng không mong muốn.

Những mục tiêu này thể hiện một sự khao khát độc lập, quyền được lựa chọn, sự đổi mới, và tự do cho các ứng dụng phần mềm. Các mục tiêu này cũng thể hiện mong muốn của các công ty và tập đoàn đạt được nhiều chức năng hơn từ những phần mềm họ đang sử dụng và giúp hệ thống máy tính của họ hòa nhập vào hệ thống phụ trợ. Có rất nhiều yếu tố khác cần được xem xét và thảo luận, nhưng danh sách này tạm thời đưa ra những thách thức lớn nhất mà các tổ chức gặp phải trong quá trình tìm kiếm, hiểu rõ định dạng văn bản được tiêu chuẩn hóa thực có ý nghĩa gì đối với môi trường công nghệ thông tin.

Nhiều mục tiêu kể trên có thể đối lập nhau. Ví dụ, liệu một định dạng văn bản thích hợp cho việc lưu trữ có cần bảo vệ nội dung của nó tránh bị sử dụng ngoài ý muốn không? Liệu định dạng này có nên hỗ trợ những cập nhật thời gian thực và sự trao đổi thông tin cần có để kết hợp với các ứng dụng và hệ thống khác không? Có vẻ như là nhiều mục tiêu thích đáng cho các tiêu chuẩn định dạng văn bản phản ánh sự đa dạng trong việc sử dụng các phần mềm. Dường như một định dạng không đủ để giúp chúng ta đạt được những mục tiêu đó.

Microsoft đang làm gì để giúp cải thiện tiêu chuẩn hóa định dạng văn bản

Trong suốt quá trình lịch sử của Office, Microsoft hỗ trợ rất nhiều định dạng văn bản trong các ứng dụng, bao gồm các định dạng nhị phân, RTF, TXT, ASCII, CSV, HTML và hàng trăm định dạng khác. Sự hỗ trợ cho các định dạng dữ liệu trong Office được thiết kế để giúp cho quá trình trao đổi thông tin giữa Microsoft Office và các ứng dụng và hệ thống khác được dễ dàng hơn. Microsoft đã bắt đầu quá trình chuyển tiếp sang các định dạng XML trong Office 2000, trong khi giới thiệu hỗ trợ cho đặc tính văn bản XML. Trong phiên bản Microsoft Office được phát hành vào năm 2007, hỗ trợ định dạng bổ sung như “PDF và XPS (mới được đưa ra)” đang bắt đầu được giới thiệu để cải thiện khả năng của Microsoft Office trong việc trao đổi thông tin với các hệ thống khác.

Những người sử dụng Microsoft Office trong các cơ quan tư nhân và nhà nước vừa muốn có lợi từ các định dạng dữ liệu được tiêu chuẩn hóa và mở rộng, vừa muốn giữ khả năng làm việc với nội dung trong những văn bản hiện có. Trong kỹ thuật, tính tương thích ngược là một chức năng rất cần thiết. Microsoft đang làm việc với các công ty và tập đoàn khác cùng ngành để thiết kế và chứng minh tiêu chuẩn Ecma Open XML sẽ đạt được những mục tiêu đề ra.

Bắt đầu từ tháng 12 năm 2005, Microsoft bắt đầu tham gia vào một nỗ lực được chỉ đạo bởi cơ quan tiêu chuẩn quốc tế, Ecma International, để cùng làm việc, công bố một hệ thống tiêu chuẩn dành cho văn bản. Mục tiêu chính của tiêu chuẩn này là để miêu tả đầy đủ các thông tin được lưu trữ trong hàng nghìn văn bản đã được tạo ra trong quá khứ. Hướng đi này sẽ cho phép người sử dụng dễ dàng dịch chuyển những văn bản có sẵn sang định dạng dữ liệu mới. Cùng với Apple, Novell, Toshiba, Statoil, Thư viện Quốc hội Mỹ và nhiều tổ chức khác, Microsoft đã làm việc trong Ủy ban Kỹ thuật Ecma #45 để có đủ tài liệu dẫn chiếu và phát hành định dạng Ecma Office Open XML.

Trong tháng 12 năm 2006, định dạng Ecma Office Open XML đã được thông qua như một tiêu chuẩn quốc tế có thể được sử dụng bởi bất kỳ một chuyên viên thiết kế nào, bao gồm cả những đối thủ của Microsoft. Giờ đây chúng ta không bị bắt buộc sử dụng một ứng dụng hoặc chương trình đặc biệt nào để đọc văn bản, ngược lại chúng ta có quyền được lựa chọn giữa rất nhiều ứng dụng hỗ trợ việc trao đổi dữ liệu. Nhóm kỹ thuật đã nỗ lực làm việc cần cù để thiết kế định dạng Open XML trong khi vẫn giữ được khả năng của các định dạng văn bản cũ, giúp đưa ra một hướng đi rõ ràng và thực tiễn cho những người đang tìm cách chuyển văn bản sang một môi trường mở rộng một cách dễ dàng. Với một tiêu chuẩn định dạng văn bản quốc tế được phát hành và mở rộng, quá trình trao đổi văn bản giữa các ứng dụng và hệ thống sẽ trở nên dễ dàng hơn, và chúng ta sẽ có thêm nhiều lựa chọn ứng dụng và nền tảng.

Thị trường kinh doanh các ứng dụng hiệu năng rất tán thành định dạng Open XML. Novell đang giới thiệu một phiên bản của bộ OpenOffice, có thể đọc và viết định dạng Open XML. Corel sẽ giới thiệu hỗ trợ cho định dạng Open XML trong bộ WordPerfect trong năm 2007. Microsoft đang giới thiệu dụng cụ thích ứng cho định dạng Open XML, giúp người dử dụng Office 2000, XP và phiên bản 2003 có khả năng đọc và viết định dạng Open XML. Bộ Office 2007 mới được phát hành cũng sử dụng định dạng Open XML như định dạng dữ liệu mặc định. Sự chấp nhận định dạng Open XML một cách nhanh chóng và rộng lớn này đã biểu lộ mong muốn của các nhà cung cấp và người sử dụng phần mềm được lưu trữ văn bản của họ trong những định dạng dữ liệu mở. Sự lựa chọn nhằm hỗ trợ định dạng Open XML là một dấu hiệu khả quan từ cộng đồng, rằng các định dạng này sẽ cung cấp những giá trị quan trọng cho con người.

Định dạng văn bản mở (ODF)

Năm 2006, một tiêu chuẩn định dạng văn bản khác đã được tổ chức Tiêu Chuẩn Quốc Tế (ISO) thông qua. Định dạng văn bản mở (Open Document Format) có nguồn gốc là định dạng “Open Office XML Format,” được thông qua bởi OASIS như tiêu chuẩn định dạng văn bản năm 2005. Khởi đầu, ODF được thiết kế như một định dạng văn bản cho OpenOffice.org, dự định là một đặc trưng kỹ thuật định dạng văn bản giúp đỡ cho quá trình trao đổi giữa OpenOffice.org và các ứng dụng khác. Sự quan tâm đến OpenOffice.org tăng nhanh một cách đáng kể sau khi Commonwealth of Massachusetts tuyên bố các định dạng văn bản mở đã được các cơ quan của chính phủ sử dụng để trao đổi văn bản. Chính sách này đã tạo nên một làn sóng các câu hỏi quan trọng về định dạng văn bản, bao gồm vai trò của PDF, khả năng truy cập và kỹ năng hỗ trợ, và các chương trình cần để đọc và viết ODF.

ODF được thiết kế để đại diện cho chức năng của sản phẩm OpenOffice.org, với tên ban đầu là “Open Office XML Format.” Khác với định dạng Open XML vốn được thiết kế để chuyển mang thông tin trong các tài liệu của phiên bản được kế thừa, ODF không được thiết lập để miêu tả nội dung đã tồn tại trong các văn bản có sẵn; ODF chỉ được thiết kế để phản ánh những thông tin được tạo ra bởi một ứng dụng. Ví dụ, Ủy ban kỹ thuật ODF trong bộ phận tiêu chuẩn OASIS tuyên bố rằng ngôn ngữ đánh dấu tiêu chuẩn hóa cho công thức bảng tính (như là “SUM” và “AVERAGE”) đang nằm ngoài phạm vi quan tâm của họ.

ODF cũng hỗ trợ phần lớn các hệ thống kinh doanh chính ngày nay. Những khách hàng sử dụng Microsoft Office có thể tải xuống và cài đặt một phần bổ sung miễn phí từ cộng đồng phần mềm Open Source để giúp chueyern đổi văn bản sang ODF. Open Office cũng sử dụng ODF. Corel vừa thông báo sẽ hỗ trợ ODF trong năm 2007. Các ứng dụng kinh doanh hiệu năng như Koffice, ABIWord và các ứng dụng khác cũng sẽ đang hỗ trợ ODF.

Liệu đây có phải là hai định dạng được thiết kế để làm cùng một việc không?

Các nhà hùng biện xoay quanh chủ đề tiêu chuẩn hóa ODF và Open XML đã tranh luận rất gay gắt về những tính năng đặc sắc của từng định dạng. Trường phái ủng hộ ODF khẳng định rằng Open XML và ODF được thiết kế cho cùng một mục đích, vậy nên chúng ta chỉ cần một định dạng tồn tại. Những người ủng hộ Open XML, cùng với phần lớn những người sử dụng khác, tin tưởng rằng Open XML và ODF được thiết kế cho từng mục đích khác nhau, và tồn tại song song để đáp ứng nhu cầu đa dạng của người sử dụng (như PDF, RTF, HTML và rất nhiều định dạng văn bản và dữ liệu khác). Những định dạng văn bản khác như PDF và UOF cung cấp những ví dụ điển hình chứng minh rằng những mục đích thiết kế cụ thể giúp hình thành tính hữu ích của một định dạng văn bản. PDF là một định dạng văn bản cố định để trình bày nội dung của một văn bản không được quyền chỉnh sửa thêm nữa, trong khi UOF là một tiêu chuẩn mà chính phủ Trung Quốc dự định sẽ đưa vào sử dụng trong nước.

Rất nhiều cuộc tranh luận đã xảy ra xung quanh quá trình tiêu chuẩn hóa ODF và Open XML. Nhiều người tranh luận hàng giờ về những chi tiết kĩ thuật đặc tả của các định dạng này. Một vài người khác tranh luận về các điều khoản nên có của luật tài sản trí tuệ trong định dạng văn bản. Thật sự, định dạng Ecma Office Open XML và định dạng Open Document có rất nhiều điểm giống nhau trong quá trình tiêu chuẩn hóa. Cả hai tiêu chuẩn đều phải trải qua một quá trình xét duyệt rất dài bởi nhiều nhóm từ nhiều công ty khác nhau. Cả hai định dạng đều bắt nguồn từ một sản phẩm phần mềm; ODF từ OpenOffice (ban đầu có tên là “Định dạng văn bản Open Office XML”), và Open XML từ các định dạng tệp sở hữu riêng như .doc, .xls, và .ppt của phiên bản Office cũ.

Sự khác nhau chính giữa định dạng ODF, Open XML và các định dạng khác không dựa trên quan điểm chính trị hay tranh cãi. Khi được so sánh với định dạng Open XML, đặc tả ODF được coi là ngắn và đơn giản, nhưng không đủ khả năng miêu tả nội dung của những văn bản đã tồn tại từ trước. Đặc tả định dạng Open XML được tối ưu với mức độ chuẩn xác và chi tiết cần thiết để chuyên chở hàng nghìn dữ liệu đã tồn tại từ trước, bao gồm đặc tả hoàn thiện cho công thức bảng tính và các tính năng khác đang thiếu đặc tả ODF. Định dạng Open XML cũng đưa ra một khả năng độc đáo là lưu giữ các ngôn ngữ dữ liệu theo ý khách hàng trong định dạng văn bản. Các tổ chức và công ty có thể sử dụng định dạng Open XML để báo cáo thông tin từ các ứng dụng và hệ thống khác mà không phải chuyển đổi ngôn ngữ lập trình trước. Khả năng này là một sự đổi mới quan trọng giúp các chuyên viên thiết kế trong quá trình tìm cách đưa các thông tin thương mại thời gian thực vào các văn bản của họ, hoặc cho những người có nhu cầu gán “thẻ” cho hệ thống được phân loại riêng, giúp họ tăng thêm hiểu biết về nội dung văn bản.

Sự hỗ trợ cho định dạng ODF và Open XML, cũng như PDF, RTF và HTML trong những bộ phần mềm về hiệu năng thừa nhận một sự thật rằng chúng ta cần rất nhiều định dạng văn bản để làm việc. Nhằm hỗ trợ cho những nhu cầu đa dạng về định dạng văn bản, rất nhiều dự án chuyển dịch đang được phát triển, nhằm nâng cấp quá trình dịch giữa các định dạng Open XML, ODF, UOF, PDF,… Thật sự, đối với những khách hàng mong muốn định dạng phức tạp, nhu cầu của họ đang được đáp ứng bởi các sản phẩm được thiết kế để hỗ trợ các định dạng phức tạp và bởi các sử dụng các phương tiện dịch để trao đổi thông tin giữa các định dạng này.

Liệu chúng ta có thể chỉ cần một định dạng văn bản được không?

Khi xem xét về câu hỏi này, một điều hết sức quan trọng là chúng ta phải so sánh nó với một ví dụ dễ hình dung hơn. Phần lớn các chính phủ đều có một nhu cầu lớn về các phương tiện chuyên chở thông tin cho các công việc của chính phủ. Dù là xe chữa cháy, xe cứu thương, tàu cảnh sát tuần dương, phương tiện vận chuyển tù nhân, phương tiện vận tải hàng hóa, máy dọn tuyết, hay các nhu cầu khác, sự đa dạng tuyệt đối của các nhiệm vụ và nhu cầu của dân chúng đòi hỏi nhà nước phải có tính linh hoạt trong việc sử dụng những phương tiện hợp lý nhất cho từng công việc. Tương tự, các định dạng văn bản mở mang rất nhiều ý nghĩa đối với mọi người, và một định dạng văn bản không thể đáp ứng được hết danh sách những nhu cầu nảy sinh trong vô số các trường hợp mà văn bản được tạo ra và sử dụng. Chỉ một chiếc xe cứu thương không thể là một lựa chọn tối ưu để làm sạch đường, cũng như máy dọn tuyết không thể có ích trong việc chuyên chở người dân đi làm. Thực tế của việc sử dụng phần mềm ngày nay gợi ý rằng sự tồn tại của rất, rất nhiều các định dạng dữ liệu là nhằm thỏa mãn sự đa dạng đáng kinh ngạc về nhu cầu trong ứng dụng phần mềm. Định dạng dữ liệu ảnh, định dạng văn bản soạn thảo, định dạng lưu trữ, định dạng bảng tính, định dạng dàn trang, định dạng thư điện tử, định dạng biểu đồ, và vô số các định dạng khác tồn tại để thỏa mãn các nhu cầu sử dụng phần mềm. Một vài định dạng văn bản được thiết kế tối ưu nhằm trình bày những thông tin cố định sẽ không bao giờ được thay đổi. Những định dạng văn bản có chức năng soạn thảo được thiết kế để làm tăng tối đa khả năng này. Những định dạng đặc trưng như bảng tính hoặc định dạng văn bản dàn trang được thiết kế phù hợp với những như cầu ứng dụng phần mềm và hệ thống cụ thể.

Bạn hãy thử tưởng tượng một hoàn cảnh thường thấy khi bạn cần PDF, Microsoft Office Excel, và Microsoft Project. Tất cả các chương trình này chia sẻ thông tin, và có thể miêu tả thông tin từ một dự án cụ thể vào bất cứ thời điểm nào. Thế nhưng nhập chung tất cả những định dạng này vào một văn bản sẽ rất vô lý và các số liệu trong từng định dạng này được tạo ra với các mục đích rất khác nhau. Các văn bản PDF cho ứng dụng này sẽ có mục đích là giúp hiển thị phiên bản thông tin cuối cùng. Excel có thể được sử dụng để thực hiện quá trình phân tích dữ liệu, việc mà PDF không thích hợp để làm. Dữ liệu Project bao gồm thông tin về các nhiệm vụ và các nguồn thông tin có thể được soạn thảo bởi người làm dự án, nhưng lại không thích hợp cho việc phân tích và sự phân bố khái quát trong phiên bản hoàn thiện cuối cùng. Kết hợp cả ba định dạng văn bản này sẽ là không thiết thực.

Trên thực tế, nguyên lý duy nhất của sự trao đổi định dạng văn bản (bao gồm tính hữu ích trong các ứng dụng phức tạp, và tính tương thích tối đa với những văn bản có sẵn) đòi hỏi khả năng lựa chọn những định dạng phù hợp nhất với nhiệm vụ hiện thời. Xây dựng luật và ủy nhiệm chức năng của một định dạng văn bản là một thước đo không có cơ sở và không phản ánh được thực trạng của việc sử dụng phần mềm ngày nay.

Bạn có thể làm gì về định dạng văn bản để mang lại những kết quả tốt nhất cho cơ quan, doanh nghiệp của bạn?

Một lợi thế của các định dạng dữ liệu mở là sự dễ dàng hỗ trở nhau giữa các phần. Microsoft cung cấp một bộ thich ứng, tạo điều kiện hỗ trợ cho định dạng Open XML trong Office 2000, XP và 2003. Microsoft và nhiều nhà cung cấp phần mềm khác đang cung cấp chương trình bổ sung miễn phí cho Microsoft Office để lưu trữ các văn bản sử dụng định dạng PDF. Bộ chuyển đổi miễn phí với nguồn mở để hỗ trợ ODF trong Microsoft Office hiện đang có tại trang sourceforge.net. Những người sử dụng Office XP, 2003 hoặc 2007 có thể cài đặt thêm hỗ trợ ODF cho Office của họ một cách dễ dàng.


Ngoài bộ chuyển đổi được cài trên từng máy tính để bàn, Microsoft cũng cung cấp những công cụ cho việc phân tích và di chuyển khối lượng lớn các văn bản. Office Migration Planning Manager bao gồm một công cụ quét tệp và công cụ chuyển đổi tệp, giúp các tổ chức có thể chọn ra định dạng văn bản đang được sử dụng và giúp họ đưa ra những quyết định đúng về việc nên chuyển tệp nào sang định dạng Open XML. Office Resource Kit cũng bao gồm những chỉ dẫn giúp bạn triển khai và quản lý các định dạng văn bản. Công cụ chuyển đổi tệp trong Office có thể chuyển đổi thử mục văn bản sang định dạng Open XML cho những tổ chức đang tìm cách di dời các văn bản sang một môi trường mở rộng. Microsoft cam kết sẽ hỗ trợ cho khả năng tương tác liên thông hệ thống và cung cấp thêm nhiều sự lựa chọn cho khách hàng. Các tổ chức đang cố gắng chuyển đổi văn bản sang dạng mở có thể sử dụng tùy thích những công cụ hiện thời, kỹ thuật định dạng tệp mở, và sự tận tụy của Microsoft để hỗ trợ cho họ trong thời kỳ chuyển tiếp sang một môi trường mở rộng.


Muốn biết thêm thông tin

Để biết thêm thông tin về định dạng Open XML, hệ thống Microsoft Office 2007, Ecma International hoặc các thông tin khác, các bạn có thể tham khảo thêm các nguồn thông tin sau:

http://www.ecma-international.org

http://www.microsoft.com/office

http://www.technet.microsoft.com

http://www.openxmldeveloper.org

No comments: