Category Archive: 中国語

post by yamamoto | | 0 | 788 views

Sony 的智慧手機新旗艦 Xperia Honami

NTT Docomo 在 2013 的秋季不打算出新機種的數位手機,所以想換手機的客戶可能要等到冬季。 個人最有興趣的是,號稱 Sony 新旗艦的 Xperia Honami , 預計可能會在9月6-11日舉辦的德國「IFA 2013」會期中正式發表。 這是網路上流出的圖檔。以下是大概的規格。 CPU Snapdragon 800(2.3GHz、四核) OS Android 4.2 記憶體 2GB RAM 電池容量 2700~3000mAh 隨身聽的音響晶片組 畫面 full HD(1920×1080)IPS-NEO 顯示器 畫面尺寸 5英吋 照相機 2000萬畫素 Exmor RS for Mobile   CPU的處理能力是 Xperia Z 的 2 倍,照相機的畫質也增強的很多, 影像偵測器的面積也是 Xperia Z 的 2 倍左右,而且首度採用追求高畫質的 Cyber shot 用的 Lens G 鏡頭。 另外,音響方面採用雙立體音音箱,和高檔隨身聽用的全數位擴大器「S-Master MX」。 不僅是高效能的智慧手機,也接近了高檔的數位相機跟高檔隨身聽。 參考網站 http://matome.naver.jp/odai/2136793569600892701 http://getnews.jp/archives/378020  

post by yamamoto | | 0 | 562 views

果粉? アップルファンのことか?

「果粉」という言葉が気になっていて、 良く読んだら、多分「アップルファン」の意味だろう   果=蘋果=アップル 粉=粉絲=ファン   ちなみに「粉絲」(fen3 si1)は春雨のことだ。 英語の fans に似ているからね。  

post by yamamoto | | 0 | 752 views

從沖繩本島開車可到的離島

瀨長島 奧武島(南城市) 平安座島 濱比嘉島 宮城島 伊計島 藪地島 奧武島(名護市) 屋我地島 古宇利島 瀨底島  

post by yamamoto | | 0 | 911 views

中国語 自然言語処理 NLP リンク集

簡体字中国語サイト 中文自然语言处理开放平台 中国人工智能网 我爱自然语言处理 清华大学自然语言处理组 HNC自然语言处理网站 中国科学院计算技术研究所自然语言处理研究组 繁体字中国語サイト NTU NLPL's Homepage台大自然語言處理實驗室 陳鍾誠的網站 自然語言處理 (Natural Language Processing) 清華大學·自然語言處理實驗室

post by yamamoto | | 0 | 690 views

perl memo UTF-8 文字列の検索

ある UTF-8 のファイルの中身に下記のような簡体字中国語があります。 ーーーーーーーーーーー 14.7.4 间气 qi at sides 左右间气 客气中在司天之气和在泉之气左右的气。司天之气的左间右间和在泉之气的左间右间,合之为四间气。 ーーーーーーーーーーー そこで「。」がない行とある行と区別するため、index 関数を使ってみました。 すると、 # $line はファイルから読み込んだ1行とする index($line,"。") は全部 -1 が戻されますが、 index(Encode::decode_utf8($line),"。") がちゃんとポジションの数字が戻されます。

post by yamamoto | | 0 | 907 views

テキストエディタ正規表現 メモ

14.7.2 司天 celestial control 司天之气 客气中主司上半年气候、物候等变化的主岁之气。 14.7.3 在泉 terrestrial effect 在泉之气 客气中主司下半年气候、物候等变化,与司天相对之气 ーーーーーーーーーーー 上記の文の「与司天相对之气」の最後に「。」がありませんでした。 いくら Abbyy FineReader 11 の精度が高くてもこのように抜けるところも出てきます。 こうこうパターンを探すのは下記の正規表現を使います。(テキストエディタは Mac 用の mi です。) ^[^0-9][^\r\n]+[,|、|。][^\r\n]+[^。a-z]$ ^[^0-9] ⇒ 行頭に数字ではない。 [^\r\n]+ ⇒ 改行ではない文字が続く [,|、|。] ⇒ 「,」「、」「。」が改行以外の文字に挟まれている [^\r\n]+ ⇒ 改行ではない文字が続く [^。a-z]$ ⇒ 行末に「。」「a-z」のアルファベットではない ーーーーーーーーーーーー このようなやり方は実に面白く強力ですね。わざわざプログラミングしなくても綺麗に整形できるからです。 ちなみに、iPad のアプリ Textastic Code Editor も正規表現の置換えができます。

post by yamamoto | | 0 | 797 views

perl memo UTF-8 の置換え問題

perl 5 ( version 12 )を使ってUTF-8を置換えするとき、うまく行けませんでした。 原因はわかりませんが、下記の現象が起こります。 my $content = "阴阳学说 yin-yang theory 中国古代哲学理论范畴。阴阳的对立统一是天地万物运动变化的根本规律。"; $content = ~s/theory/null/g; print "$content¥n"; 【期待した結果】 阴阳学说 yin-yang  中国古代哲学理论范畴。阴阳的对立统一是天地万物运动变化的根本规律。 【実行結果】 18446744073709551615 原因が分かり方はぜひお教えください。 しばらく下記の関数でやっております。 sub ReplaceAll {     my $string = Encode::decode_utf8(shift);     my $str1 = Encode::decode_utf8(shift);     my $str2 = Encode::decode_utf8(shift);     for (my $i=0 ; $i <= length($string); $i+=length($str1)){         my $pos=index($string, $str1, $i) ;         if ( $pos>=0){             substr($string, $pos, length($str1),$str2);        ...

post by yamamoto | | 0 | 752 views

perl tips 文字列に英文以外の文字を取り出す

#!/usr/bin/perl use strict; use Encode; my $content = "阴阳学说 yin-yang theory 中国古代哲学理论范畴。阴阳的对立统一是天地万物运动变化的根本规律。"; print "$content\n"; my $notlatin = GetNotLatin($content); print $notlatin,"\n" ; sub GetNotLatin { my $string =shift; $string.=" "; my @alph_list = ('A' .. 'Z', 'a' .. 'z','\'','.','(',')','-' ); my @string = (); my @word = (); foreach my $character (split //, $string) { if ( grep {$_ eq $character} @alph_list ){ push(@string, $character); } else {     if ($#string>0){         push(@word, ...

post by yamamoto | | 0 | 792 views

李白 靜夜思

床前明月光,疑是地上霜。 舉頭望明月,低頭思故鄉。   日本語説明

post by yamamoto | | 0 | 718 views

日本語版Windowsで中国語入力

いままでIMEのピンインで中国語を入力してきましたが、最近Googleの谷歌拼音中文輸入法で入力することに変更しました。 学習機能がありますので、とても便利で早いですね。日本語の入力もGoogleのほうに変更しました。 ちなみに台湾は繁體字なので、繁體字モードにすれば、谷歌拼音中文輸入法もそのまま繁體字を打てますね。