「タイ語で検索しよう」

IWDD春のライトニングトークまつり、というのがこの間の土曜日にあって、そこでネタを4つほど披露した。まあ3つ目は食べ物提供の前振りで、4つ目は今までうまくつなげなかったWiiを頑張って繋げたよ!とう報告だけだったのでここに残しておくまでもない。*1

残り2つのうち、1つ目が表題の話。まあ、タイ語でSEOに書いたことの焼きなおしと言われると、その通りという話でもあるんだけど、以下に採録しておく。プレゼンに使ったパワポおいてもたぶん参考にならないだろうし。

多国語を日本語表記、アルファベット表記する際の問題。

ある言葉があったとして、それをどのように他国の言語で表記するか、というのは難しい問題だ。固有の文字を持たない国はとりあえず除外するとしても。日本語は外来語を取り入れやすい言葉、とはよく日本人が言うけど、声調を示せず母音も文字的には5種類しかない文字で外来語を取り入れたら、それは似ているけど違う言葉だろうな、と。これは英語でもそうで、あちらはあちらである発音に対するスペルが一定していないから、一定の基準を示さない限り表記揺れの問題はついて回る。

タイ語の場合「こんにちは」は「サワディ」だとよく言われるけど、日本語でそれを書く際には「サワディー」「サワッディー」「サワディカ」とかいろいろあって、そう書くだけの個々の事情もあって、またこれを表記揺れで吸収すべきかどうかもよくわからない。一説にはトイレの芳香剤「サワデー」の語源がこれだ、という話があるのだけど、逆に表記揺れで吸収されてしまって、この状態では調べようがないし。
英語だと、「Sawasdee」が一般的だろうか。でも、「sawadee」もあるし、「sawatdee」もそれなりにある。これらも同一視はしてくれない。
こういうのを防ぐためには、やはりその国の文字で検索出来た方がいい。

キーボードも使える、けれど。

今どきのOSはどれも多国語対応している。キーボードだって当然のようにタイ語キーボードが標準(追加)インストール可能で、「Kedmanee」「Pattachote」と、キー配列も選べる(「 Kedmanee 」がデファクトらしい)。

でも、入れようにもキートップに刻印がないし、どの文字をどの順番で打てばいいかわからないし、もともと101キーボードの拡張で決められたキー配置、106系のキーボードを使っているとちと微妙だし、細かい記号、たぶん見落とすし、見慣れてないと、丸が外側とか少し長いとか言われても区別つかない。(ひらがなの「ね」「わ」「れ」みたいな違い。) 

なので、今回は、

  • キーボードは最後の手段
  • 使えるサイトはどんどん使う
  • 最低限の英語も使う
  • 日本語の情報を、タイ語で捕捉する*2

タイ文字で検索出来ると、日本語のサイトも見つかりやすくなりますよ、という話でいくつもり。

まずは、日本語から。

バンコクで観光、水上マーケットに行きたいがツアーだと朝が早すぎ。地元の人が利用するローカルな水上マーケットはないだろうか?」という疑問を検索で探そうとしたとして、実践してみる。

これを日本語検索で調べようとしたら、検索キーワードは「バンコク」「水上マーケット」「ローカル」あたりだろうか。これでgoogle検索すると「タリンチャン水上マーケット」なるところが見つかる。一番最初に見つかったサイトを読むと、タイ語で「タラートナム・タリンチャン」と言うらしいこともわかる。

たぶん、探していくうちに、以下のようなこともわかるはずだ。

  • 水上マーケットと言えば、「ダムヌン・サドゥアク」というところが有名。
  • 「タリンチャン」は地名のようだ。
  • 「水上マーケット」が「タラート・ナム」で、「タラート」が「市場」、「ナム」が「水」という意味。
  • 以上から想像するに、タイ語は後置修飾の言語らしい。

また、若干発展的な話になるが、タイ語(タイ文字)の豆知識としてこの辺を覚えておくとコピペがしやすくなる。

  • 子音を示す文字、母音を示す文字(記号)、アクセントを示す記号の組み合わせで作られる。
  • 基本は横書きで、文字は子音、母音の順に書いていく。母音は文字によって子音の左側や上下に書くものもある。
  • アクセント記号は子音の上に書かれる。
  • 母音も含め、上下に書く文字(記号)は対応する子音の後に入力して、子音の上下におかれるような仕組みになっているので、文字を選択してコピペする際は0文字幅の文字に注意。
  • 分かち書きは可能だが、基本的には分かち書きしない。

タイ文字表記を手に入れるために。

wikipedia内の検索で「水上マーケット」を検索すると「ダムヌン・サドゥアク」に関する情報があることがわかる。そしてそこにはダムヌン・サドゥアク郡を表記しているタイ文字もあることがわかったりする。
問題は、どの文字が「郡」を示すタイ文字かわからないことだ。
そこで、泰英辞典を活用する。こちらの辞典サイトに「bulk lookup」という機能があって、タイ文字がわからなくてもとりあえず放り込むと、言葉を意味単位、文節単位に区切って訳してくれる。固有名詞は若干弱めだけど、「郡」がどの文字かくらいはわかる。残りの部分が地名だ。

タイ文字で日本語サイトを検索する。

google、たぶん普通に使っている設定では、日本語サイトを探す設定になっているはず。というか、たぶんこういうことでもなければ「日本語でダメなら全世界」的にしか考えていないかもしれない。
で、今回は日本語サイトをタイ文字で探す、ということをやってみる。
「 ดำเนินสะดวก 」を検索してみると、wikipediaの次の次くらいに出てくるのが「 ตลาดน้ำดำเนินสะดวก 」に行った話の案内だ。*3既に地名がわかっているわけで、そこから「 ตลาดน้ำ 」が水上マーケットを意味することはわかる(わからなければさっきのbulk lookupを使えば良い)し、この言葉で検索すると出てくるのが、求める「 ตลาดน้ำตลิ่งชัน 」というタイ文字だったりもする。こうしてみると、既に日泰両方の文字でブログを書いている人は意外といることにも気がつくはずだ。

こうやってキーワードがわかれば、google mapsでこの言葉を検索して(ただし、地図の中心をタイにしておかないと見つからない)、地図上でどの辺にあるのかを調べたり、google image検索でこの言葉で調べて写真を探したり、といったことも、タイ語がわからなくても検索出来るようになる。旅行サイトでも把握し切れていない、臨時休業とか工事で一時閉鎖とか、そういう話も見つかることがたまにある(今回は見つからなかったけどね)。

まとめ

  • ローカル情報は、その地のローカル言語をキーにして調べると、いろいろ見つかる。
  • 文字はコピペでもいける。コピペ元はwikipediaを出発点にしたりと、いろいろ工夫して。(wikitionaryとかも使えますよ)
  • 泰日翻訳は見つからなくても、泰英辞典はあったりするので、英語も使えればなおよし。

ちなみに

このプレゼンを始めてから終わるまで、20分近く。手間取った部分があって少し話が延びてしまった。

追記

そうそう、ブラウザでタイ文字が小さくしか表示されない、という方は、フォントの設定をどうにかしたほうがいですよ。タイ語フォントをtahomaにするとか、そんな感じ。

*1:たぶん別のところに書くことになるのだろう

*2:補足じゃなくて捕捉なんです

*3:先ほど日本語で調べたときとは微妙に検索結果が違っているのが面白い。