日本語プログラミング言語なでしこの公式掲示板

なでしこ の 掲示板

トップ 新規 検索

2021-08-28 19:14:21

Re①:テキストファイルをUT8のみで処理する方法

雪乃☆雫 さん

まず、基本的にはなでしこv1で操作出来るのはShift_JISとなっていて、UTF8とかで作成されたファイルなどは一旦「SJIS変換」してやらなければいけないんですよね。
ただし、過去にはこんなしゅごいのもありました。ご参考になるでしょうか?
サンプルプログラム掲示板
https://eznavi.net/site/app/index2.php?pagetop=26
・・・ので、100%無理とゆうことは無いのだろうと思いますが、ちょこっと手直ししてどうにか出来る問題ではなさげです。(わたしにはムリです><)


しかし、もし、掲載のコードのような処理を行いたいと言うだけならば、v3はどうでしょうか?
v3なら逆に基本UTF8です。
v3には「漢字読み取得」の命令がありませんが、漢字を仮名にしてくれるAPIは色々あるようで、それと連携すれば可能です。

ちょっとやってみました☆ こんな感じ?
※ファイルの入出力を伴うので、node版です(簡易エディタとかでは動きません)
※gooラボのひらがな化APIを使用しています。
https://labs.goo.ne.jp/api/jp/hiragana-translation/
#-----------------------------------------------
#---APIの設定----------
URL=「https://labs.goo.ne.jp/api/hiragana」
//appidはこのまま使用せず、自前でアプリケーションIDを取得して下さい。
appid=「09ca414796c05ef82bd16dd920df60e0f602d9469c5a8c8ffa40a61b477c11b7」
type=「hiragana」

#---元データを反復してAPIへPOST----------
漢字ヨミ=空配列。出力データ=空。C=0。
変換元=「{デスクトップ}\平仮名変換元データ.txt」を開いて、改行で区切る。
変換元を反復。
  No=対象キー。
  漢字ヨミ[No]=空配列。
  漢字ヨミ[No][0]=対象。
  obj={"app_id":appid,"output_type":type,"request_id":No,"sentence":対象}。
  URLへobjをPOST送信した時には、
    結果=対象をJSONデコード。
    //上から順に処理されるわけじゃないので、リクエストIDを使って配列に格納しています。
    No=結果["request_id"]。
    漢字ヨミ[No][1]=結果["converted"]。
    C=C+1。
    もし、C=(変換元の配列要素数)ならば、
      漢字ヨミを反復。
        出力データ=出力データに漢字ヨミ[対象キー][0]&タブ&漢字ヨミ[対象キー][1]を一行追加。
      ここまで。
      出力データを「{デスクトップ}\平仮名変換読みデータ.txt」に保存。
    ここまで。
  ここまで。
ここまで。
#-----------------------------------------------


web版も作ってみました。

https://n3s.nadesi.com/id.php?732

(編集パスワード送信)

子記事

親記事 (No.1115)
返信した記事(元) (No.1115)

この内容(No.1116)に返信

この内容(No.1116)をダウンロード

この内容(No.1116)のテキスト表示





www.eznavi.net