Archive for the ‘character_code’ Category
土曜日, 9月 27th, 2014
最近、疲れた時にはぼんやり『世界の文字と記号の大図鑑 ー Unicode 6.0の全グリフ』を眺めたりする。現在のほとんどのコンピュータは文字コードの体系としてUnicodeを利用しているが、そこに含まれる約10万文字を書籍化したもの……という興味がない人にとってはなんじゃこりゃという代物だ。
「片仮名拡張」の領域を見ていると、アイヌ語仮名があった。アイヌ語をできるだけ正確に表記するために、「ㇰ」(小さな「ク」)とか、「ト゚」(「ト」に半濁点「゜」)といった仮名が使われるのだ。かなり早い段階から(今調べたら2002年のUnicode3.2から)Unicodeにアイヌ語仮名が含まれていることは知っていたのだが、懐かしかったのは「ㇽ」(小さい「ル」)。
Windows3.1が発売される前、某社でCD-ROM電子事典制作のバイトをやったことがあるのだけど、作業の1つに「ㇽ」を削除するというものがあった。その当時はまだUnicodeも検討段階で、日本語の文字コードとしてはShiftJISが一般的。「ㇽ」は外字でないと表現できず、(細かい経緯はよく知らないけど)結局取ってしまおうということになったらしい。「ボッティチェㇽリ」とあったら「ボッティチェリ」と直すわけだ。来る日も来る日も、元の事典のコピーから「ㇽ」を探して、赤字を入れる日々……。
Unicodeの辞典を眺めて、ちょっとノスタルジーな気分になった(あんまりそういう奴はいないw)。
Posted in character_code | No Comments »
金曜日, 10月 15th, 2010
「binWord/blog – Googleが絵文字の世界共通化に取り組む」で紹介した、絵文字のUnicode収録が実現した模様(日本発のケータイ絵文字が世界標準に Unicode 6.0で – ITmedia News)。
今回のUnicode 6.0では、トランプのカードや錬金術記号も収録されている。
あとは、麻雀とチェスがあれば……と思ったら、すでにUnicode 5.1で収録済みだった。ドミノや将棋のコマも(字は書かれていないけど)入ってる!(情報どうもです>@dankogai)
こういう記号が標準で使えるようになれば、Twitterベースのソーシャルゲームが爆発的に増えそう。
PICシンボルのような絵記号が増えてくると、さらに面白いことになるんじゃないだろうか。言葉の通じない外国人とも、「???」のように会話したり、さらにさらにTwitter上でシンボルを使ったコミュニケーション用言語が生まれたりして!
そういえば、昔シンボルを使って異星人だったか(要は人工無脳)と会話するゲームが出ていたような気がするんだけど、あれは何といったかな……。
Posted in character_code | No Comments »
金曜日, 11月 28th, 2008
日本の携帯電話で使われている絵文字。Googleは、この絵文字を世界共通化しようとしているそうな(Google Japan Blog: 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ)。文字体系Unicodeのコードを割り当てて全世界のコンピュータで扱えるようにすることを目指すということで、これまた大きな話だ。
(さらに…)
Posted in character_code, mobilephone | No Comments »
土曜日, 6月 21st, 2008
日本Ruby会議2008で、面白いと思ったネタのメモ。あくまでも非プログラマの視点ですが。
(さらに…)
Posted in character_code, event, programming | No Comments »
日曜日, 5月 11th, 2008
Leopardの辞書アプリ(Dictionary.app)で英辞郎を使えるようにしたおかげで、海外のサイトを読むのもずいぶん楽になった。しかし、単語の意味などをもう少し詳しく知りたいという時は、英辞郎だとちと物足りない。そこで、だいぶ前に買ったまま、ほとんど活用していなかったランダムハウス英語辞典(第二版)をDictionary.app用に変換してみることにする。
ランダムハウス英語辞典が使えるMac用の辞書ソフトとしては、すでにJammingがあるが、できればDictionary.appにまとめたいところ。検索機能はJammingが格段に優れているが、日常的にさっと調べるならDictionary.appの方が使いやすく感じる。まあ、変換処理自体が面白くなってきたというのもあるのだけど。
(さらに…)
Posted in character_code, dictionary, English, Mac, programming, XML | 4 Comments »
火曜日, 11月 6th, 2007
先の記事でも書いたように、Mac OS X v10.5 “Leopard”の「辞書」アプリケーション(辞書.app / Dictionary.app)用の辞書はユーザーが追加できるようになっている。そこで、定番の英和辞書「英辞郎」を変換するツールを作ってみた。英辞郎は、現時点で最新のv108を使用している。
(さらに…)
Posted in character_code, dictionary, English, lifehack, Mac, programming, XML | 175 Comments »
日曜日, 9月 2nd, 2007
私はWebのニュースをチェックする場合、各サイトのトップページから興味のあるすべての項目をタブで開き、見終わったタブから次々閉じていくというやり方をしている。Firefoxなどのタブブラウザを利用している人ならば、ごく一般的な使い方だろう。
こうやってニュースチェックをしている途中で外出しなければならないことはよくある。そんな時、移動中にPDAや携帯電話のフルブラウザを使ってニュースチェックの続きができればなあと思っていた。複数パソコンでブラウザにFirefoxを使っているなら、Google Browser Syncを使えばいいが、携帯電話やPDAではそうもいかない。はてなブックマークのようなソーシャルブックマークを使うという手もあるが、記事ごとに登録していくのは面倒だ。また、不正な利用を避けるためか、こういうソーシャルブックマークサービスでは自動処理が行えなくなっている。
そこで、現在タブで開いているページへのリンクを1つのHTMLファイルとして生成し、自分が使っているWebページサービスやレンタルサーバーなどにアップロードすればよいのではないかと考えた。
(さらに…)
Posted in character_code, lifehack, Mac, net, PDA, software | No Comments »
木曜日, 10月 20th, 2005
JAGAT(日本印刷技術協会)が主催する「紙面制作の自動化とページデザイン」のセミナーに参加してきた。PCJapan用語辞典のワークフロー作りをお手伝いしたということで、無理を言ってタダで(←ここ重要(笑))聴講させてもらったのだ。
このワークフローについて簡単に述べておこう。ハッカー用語辞典2004まではMac OS 9+QuarkXPressの環境だったが、PCJapan用語辞典2005からはDTPプロダクションのビーワークスと話し合ってInDesignを使ってもらうことにした。私の立場からの理由は2つ。XMLとUnicodeである。
PCJapan用語辞典の制作ではデジタル版(WindowsのHTML Help形式)を作るためにDTPデータを再利用したい。そのために、XMLでデータをやり取りできれば作業がスムーズに行くと考えた。
(さらに…)
Posted in character_code, DTP, editing, lifehack, programming, XML | No Comments »
土曜日, 3月 26th, 2005
Mac OS XはUNIXをベースにしたOSで、UNIX用に開発された多彩なソフトウェアを利用できる。こうしたソフトウェア群を簡単にインストールするため、Finkというパッケージが用意されているのだが、このFinkでは日本語環境のことが考慮されていなかった。そのため、日本語を使おうとすると、ユーザーがあれやこれやと設定ファイルをいじくり回す必要があった。
私もMac OS XでUNIXソフトウェアを使うことに興味はあったものの、ちょっと手が出せずにいた。こうした状況を、東大Finkチームが変えつつある。2003年末に東大ではiMacを大量導入し、同時にUNIX環境の整備を開始した。本家Finkプロジェクトと連携を取りつつ、Mac OS XのUNIX環境で日本語が扱える手軽なパッケージを作成している。
3月25、26日に開催されたオープンソースカンファレンス2005では、東大Finkチームの作成したインストーラCDも配布された。これはUNIXの知識がない人間でも日本語の扱えるUNIX環境を構築できる優れものなのだ。セミナーでは、Finkを日本語に対応する苦労話などが詳細に語られていた。以下、そのメモ(私はこの分野に詳しいわけではないので、誤解している部分もあると思う)
(さらに…)
Posted in character_code, Mac | 2 Comments »
火曜日, 10月 12th, 2004
30代の男性なら、一度は民明書房発行の書籍を書店で探したことがあるのではないか。『魁!!男塾』の参考文献としてよく出てきたアレである(最近では、続編『暁!!男塾』がスーパージャンプ誌上で連載中)。最近、民明書房の書籍をまとめた『民明書房大全』が発行されたので、バカ中学生だった頃の思い出に浸ってみるのも楽しかろう。
民明書房大全には、見たこともない漢字がバンバン出てくる。例えば、私の大好きなネタ、李筴振(りばしぶる)が創始した凶獬面閶殺(きょうかいめんしょうさつ)。ネタの内容については同書を見てもらうとして、「獬」(かい)も「閶」(しょう)もJISコード(JIS X 0208)の第一水準、第二水準に含まれていない。ただし、Unicodeには収録されているので、Windows XPやMac OS Xなら問題なく扱えるし、このブログのようにUTF-8で書かれたWebページでも使える。男塾のファンサイトを運営するなら、UTF-8ベースじゃないときついかもしれない。
それにしても、民明書房大全の校正は大変だったんじゃないかな。やっぱり、DTPにはInDesignを使ったんだろうか。
Posted in book, character_code, DTP | 1 Comment »