Machine Translation of Foreign Languages

Dateline: January 4, 1998

IN writing about automatic speech recognition (ASR) software some months ago, I mentioned that automatic language translation (ALT) was waiting in the wings.

ALT means a program that sits somewhere in a voice telecommunication link between two foreigners and orally interprets for both of them in real time. Limited ALT systems have been tried, but so far have not been very good.

MT (machine translation) means a program that sits somewhere in a textual telecommunication link between foreigners and translates written text for them in nearly real time. Systran Software has developed MT programs for translating eight languages (French, Spanish, Portuguese, Italian, German, Russian, Japanese, and Chinese) to and from English. (By translating a document first into English, and then the English translation into a second foreign language, you could translate among any of the eight foreign languages, though the double translation would probably lose something in the process.)

Systran Software's capabilities are as mind-boggling in the MT sphere as Dragon Systems' NaturallySpeaking ASR program (reviewed and revisited earlier) is in the ASR sphere. Neither is perfect, but they are usable today and taken together they demonstrate clearly that the Holy Grail of ALT is, without a doubt, just a few years away.

Systranet

I don't know yet whether Systran software is AI based. Systran's Web site doesn't say. But it's almost inconceivable to me that it is not using some AI technique or other, and even if it does not, in translating from one language into another it is performing a task that most of us, I think, would say requires a fairly high level of intelligence.

According to Systran's marketing, the European Commission is using Systran software to translate documents between the EEC's numerous languages. I imagine they use the program for a first pass translation, then have human translators go through to find and fix errors. Xerox and Ford also use the software to help translate their marketing and service documents into various languages.

AltaVista (DEC's magnificent Web search engine) uses Systran software, which is how I stumbled across it. (Why I did not hear of it before, beats me.) When you do a search in AltaVista, your search results now come up with an additional option: "Translate." Clicking this automatically runs a version of Systran sitting on an AltaVista server. The text of the selected Web document is translated into the language you select from options presented. Graphics are retained, so effectively you see a (say) Spanish Web site but any text is in (say) English.

For the AltaVista service, you don't need Systran software on your PC (because it runs on AltaVista's server), the translations don't cost you a penny, and they happen very fast. I've always had the highest regard for AltaVista, and now my regard has gone through the roof. This is an exceedingly beneficial service.

Intrigued and inspired by my experience with Systran on AltaVista, I decided to try out their software on my own PC. The particular Systran service I used, called Systranet, lets you have text files on your computer translated using a 2 MB free version of Systran software written in the Java programming language. Though this version of the software is free, you have to connect with the Systran server on the Internet each time you use it. The program tells Systran how many words it translated, and you get charged one US cent per word. (Using a credit card, you must first deposit at least US$20 in your Systran account.)

According to Systran, with Systranet the actual translation is performed on their server, and the translated document is then saved on your PC's hard disk. I simply do not understand why, in that case, you need a whopping 2 megabyte program sitting on your PC whose only function, apparently, is to handle the communication chores between your PC and the Systran server.

If you would rather have the translations done on your own PC, then for prices ranging from $29 (for a stripped-down program that runs on your own Windows (any version) PC, to over $3,000 for client server software with multiuser licenses, you can skip Systranet and its penny-per-word charge and roll your own translations offline. The more you pay, the bigger your choice of languages and generally the more bells and whistles you get. The $29 version only translates one way (e.g., English to French but not French to English). For $49, the software will translate both ways. More expensive versions translate either way and include more languages.

The most expensive will also do Japanese and Chinese, and these are the ones I'd dearly like to try (my wife is Japanese and I know Chinese. Go figure . . . .) To translate Japanese and Chinese you need a program that will display Japanese and Chinese characters on your PC screen (I use Twinbridge Japanese Partner, which presumably would work with SystranPRO).

If you want to try Systranet yourself, the company is giving away $20 worth of translation free (and there's no obligation to give your credit card number or spend more if you don't want to). I tried it, and here are the steps I took:

  1. Went to www.systransoft.com
  2. Signed up for their Systranet service (giving just my name and email address)
  3. Waited a few seconds for email notification from Systran of my account number (functions as a password)
  4. Downloaded a 2.2 MB file from Systran, written in Java (about 20 minutes at 26,400 bps, fastest I can get out of my GTE phone line)
  5. Installed the file under WindowsNT 4.0 (Windows 3.1 and 95 versions also available)
  6. Ran the program. It connected me to Systran and logged me onto their server with my email address and account number.
  7. The program then opened a window asking me to enter the path and name of the text (.txt) file on my PC that I wanted to translate into another language, and gave me options for English to French, etc., and for choosing one of the available specialized vocabulary sets (e.g., for computers, medicine, etc.)
  8. It translated the file like greased lightning, and deposited the translation on my hard disk in the same directory and with the same name as my original except that it added ".fre" (for "French") to the file name.
  9. Systranet then told me how much the translation had cost, and I logged off and opened up the translated file in Notepad.

It all worked easily and painlessly. The first file I translated cost US$8.40 to translate 840 words from English into French (actually it cost nothing, since I took advantage of their free $20 "try out" offer) and the actual translation took a split second.

The result was impressive. My French is pretty poor (I took French for four years in a British grammar school 40 years ago!) but even so I remember enough to recognize that the translation of my text file (some rough notes I made while reading a book by Jorge Luis Borges), while it may or may not be very good French, and while it might contain some horrible mistakes that could lead to serious misunderstanding, is nevertheless probably understandable in the main to a French-speaking person.

To have hired a human translator to translate my text file would have been at least ten times costlier, and would have taken a great deal longer than the few minutes the whole Systranet process took (really, only steps 6 to 9 above -- steps 1 to 5 only need be performed once, and even they took only half an hour, including a 20 minute download of the Systranet program).

Before I'd trust a legal document, a love letter, or instructions for defusing a bomb to Systran, I'd want fluent bilinguals to check things out for me. (If anyone out there is bilingual in French and English, please let me know how faithful is the translation below). Systran itself tells you not to take its translations too much on trust, and also cautions you about the GIGO Factor (garbage in, garbage out). But if I were a professional translator, I'd consider SystranPRO (the top-of-the-line standalone product, just under $1,000) a business essential. It would cut costs and help me remain competitive. (If I were a translation house with a team of translators and a LAN, the client-server version of SystranPRO would be a less expensive choice.)

Appended below are the results of using Systranet to translate into French an earlier version of this article. With 1,158 words, it cost $11.58 to translate. Added to the cost of the translation of my Borges notes at $8.40, bang went my 20 free bucks, but it would have been worth every penny even if they had not been free. (Please note that since I did the translation, I've revised the English version substantially, so there are some natural differences between the French translation and this English-language article that are not the fault of Systranet.)

Future Development

If: Dragon Systems, or Kurzweil or IBM or Fonix (all players in the ASR software market) can add genuine speaker independence to their products, and if one of them then gets together with an MT company like Systran to merge their code into a single package, they will create something phone companies worldwide would kill for: automatic language translation.

I can hardly do justice here to the profundity of the impacts ALT will have on humanity. We'll be able to talk with any other human being, yet we'll be able to retain the rich variety of our human linguistic heritage and associated cultures. The global village will truly have arrived, a village rich in linguistic and cultural diversity, not the French nightmare of an English-speaking village with a McDonald's and a Disneyland on every street corner. Brits and Americans will be able to stop feeling guilty about not knowing foreign languages, and youngsters in many another country will need no longer labor under the added burden of having to learn English to get ahead. A downside is that for folks like me, who love to learn foreign languages, some of the incentive will be gone.

This won't happen overnight, and it doesn't mean that professional interpreters and translators need to rush to the employment office. It will take years -- though not, I venture, much more than a decade -- before ALT performs as well as any bilingual human. At that point, the professionals will be in trouble, and Machina sapiens will cut another notch in the stick marking the progressive deskilling of Homo sapiens.

Until next week,

 

 

 

 


NEXT WEEK: Dynamics of Mind: More comments on complexity.

Traduction Automatique De Langage

Dateline: Décembre 27, 1997

Il y a quelques mois j'ai écrit au sujet du logiciel automatique de la reconnaissance de la parole (ASR), et j'ai également mentionné que la traduction automatique de langage (alt) attendait dans les ailes. Bien, elle est ici, et comme le programme du NaturallySpeaking ASR de dragon des systèmes, le logiciel de l'alt de Systran est époustouflant, même si il a quelques verrues.

Je ne sais pas encore si le logiciel de Systran est AI basée. Le site Web de Systran ne mentionne pas comment le logiciel fonctionne. Mais il m'est presque inconcevable qu'il n'utilise pas une certaine technique ou autre de AI, et jusqu' à moi peut obtenir la confirmation ou réfutation, je vais supposer que la AI est là. Même si Systran n'utilise aucune technique définie comme appartenant au monde de AI, ce néanmoins est un programme qui fait quelque chose -- traduit d'un langage en des autres que les la plupart de nous, je pensent, dirait exige un niveau assez élevé d'intelligence.

Selon le marketing de Systran, la Commission européenne emploie le logiciel de Systran pour traduire des documents entre les nombreux langages d'EEC's. J'imagine qu'ils utilisent le programme pour une première traduction de passe, puis font intervenir aux traducteurs humains pour trouver et fixer des erreurs. J'imagine que c'est un épargnant énorme de temps et d'argent.

AltaVista (Search Engine magnifique de Web de DEC's) utilise le logiciel de Systran, qui est comment j'ai trébuché à travers lui. (avant pourquoi je n'ai pas entendu parler de lui, me bat.) Quand vous faites une recherche dans AltaVista, vos résultats de recherche maintenant sont soulevés avec une option supplémentaire: " traduisez. " Cliqueter ceci exécute automatiquement une version de Systran se reposant sur un serveur d'AltaVista au-dessus du texte du document choisi de Web et vous donne une traduction. Pour ceci, vous n'avez pas besoin du logiciel de Systran sur votre machine, les traductions ne vous coûtent pas un penny, et elles se produisent très rapidement. J'ai toujours eu le respect le plus élevé pour AltaVista, et maintenant mon respect est passé par le toit. C'est un service excessivement salutaire - merci, poids du commerce!

Le service particulier de Systran que j'ai utilisé, appelé Systranet, vous laisse avoir des fichiers des textes sur votre ordinateur traduit sans acheter leur logiciel. Ils vous donnent une version du logiciel pour libre, mais exigent de vous de vous relier au serveur de Systran sur l'Internet chaque fois que vous l'utilisez. Le programme indique à Systran combien de mots il a traduits, et vous obtenez avez chargé un cent des USA par mot. La traduction réelle est exécutée sur votre propre ordinateur et le document traduit est enregistré sur votre ordinateur.

Pour des prix s'étendant de $29 (pour un programme stripped-down-vers le bas qui exécute sur votre propre PC de Windows (toute saveur), à $19.000 et à plus pour le logiciel de serveur de client avec les permis à utilisateurs multiples, vous pouvez sauter Systranet et sa charge de penny-par-mot et rouler vos propres traductions en différé. Plus que vous payez, le plus grand votre choix des langages et généralement plus les cloches et les sifflements vous obtenez. La version $29 traduit seulement l'one-way (par exemple, anglais-français mais non français-anglais), alors que des versions plus chères traduisent l'une ou l'autre voie et incluent plus de langages. La volonté la plus chère font également japonais et chinois, et ce sont ceux que je voudrais chèrement essayer (mon épouse est japonaise et je sais le chinois. Disparaissent la figure. Pour traduire japonais et le Chinois vous avez besoin d'un programme caractère-character-generating -- j'utilise l'associé de Japonais de Twinbridge.

Si vous utilisez Systranet, vous pouvez ou déposer l'argent avec eux à l'avance et l'épuiser car vous faites faire des traductions, ou vous pouvez obtenir la satisfaction instantanée en écrivant votre nombre de carte de crédit. Vous obtenir a commencé, cependant, la compagnie donne loin à $20 la valeur de la traduction librement (et il n'y a aucune obligation de dépenser plus si vous ne voulez pas).

Tout que j'ai dû faire pour obtenir ceci fait était:

  1. Montez au signe de www.systran.com
  2. pour leur attente
  3. de service de Systranet (donnant juste mon nom et email address) que quelques secondes pour l'avis d'email de Systran de mon compte le numéro (fonctions comme mot de passe)
  4. téléchargez un fichier du mb 2,2 de Systran, écrit dans Java (environ 20 minutes à 26.400 bps, de plus rapide je puis sortir de ma ligne téléphonique de GTE)
  5. installez le fichier sous WindowsNT (3,1 et 95 versions également disponibles)
  6. exécutent le programme. Il m'a relié à Systran, que je pense fondamentalement juste confirme que le mot de passe est correct et permet au programme de traduire.
  7. Le programme a alors ouvert un Window me demandant que écrire la voie d'accès et le nom du fichier des textes (txt) sur mon PC que je veux traduire en un autre langage, et me donner des options pour anglais-français, etc., et pour choisir un du vocabulaire spécialisé disponible place (par exemple, pour les ordinateurs, la médecine, etc...)
  8. Il a traduit le fichier comme la foudre graissée, et a déposé la traduction dans le même répertoire et avec le même nom que mon original sauf qu'il a ajouté l'" fre " (pour l'" Français ") au nouveau nom de fichier.
  9. Systranet m'a alors indiqué que combien la traduction avait coûté, et j'ai sorti et ai ouvert de " Borges Labyriths.txt.fre 1964 " dans le notepad.

Cela tout a fonctionné facilement et sans douleur. Le fichier de Borges a coûté USS8.40 pour traduire 840 mots de l'anglais en français (il n'a coûté réellement rien, puisque j'ai tiré profit de leurs $20 libres " essaye " l'offre) et la traduction réelle a pris un deuxième fendu sur ma machine de 266 mégahertz Pentium II.

Le résultat était impressionnant. Mon français est assez pauvre (j'ai pris des Français pendant quatre années dans une école britannique de grammaire il y a 40 ans!) mais néanmoins je me rappelle assez pour identifier que la traduction de mon fichier des textes (quelques notes approximatives que j'ai faites tout en lisant un livre par Jorge Luis Borges), alors que ce peut ou peut ne pas être le français très bon, et tandis qu'il pourrait contenir quelques erreurs horribles qui pourraient mener au malentendu sérieux, est néanmoins probablement compréhensible principalement à une personne de langue française.

Avoir loué un traducteur humain pour traduire mon fichier des textes aurait été au moins dix fois plus coûteuse, et aurait pris beaucoup plus longtemps que les quelques minutes le processus entier de Systranet a pris (vraiment, seulement étapes 6 à 9 ci-dessus -- étapes 1 à 5 doivent seulement être exécutées une fois, et les égalisent ont pris seulement une demi-heure, y compris un téléchargement de 20 minutes du programme de Systranet).

Si j'étais un traducteur, une copie de SystranPRO -- le dessus du module de ligne -- serait des affaires essentielles.

Toujours, avant que je fasse confiance à un document juridique, à une lettre d'amour, ou à des instructions pour désamorcer une panne à Systran, je voudrais que les bilinguals fluents examinent des choses dehors pour assurer moi. (si n'importe qui dehors il y a bilingue en français et anglais, svp me font savoir fidèle est la traduction ci-dessous). Systran lui-même vous dit de ne pas prendre à ses traductions trop de la confiance.

En conclusion, voici les résultats d'employer Systranet pour traduire en français cet article entier -- 1.158 mots, coût: $11,58. Le coup est allé mes 20 mâles libres, mais il a valu la peine chaque penny.

Avec les meilleurs souvenirs,

David

Previous Features