日本語プログラミング言語なでしこの公式掲示板

なでしこ の 掲示板

トップ 最新 新規 検索 公式

2019-11-09 16:29:06 -土 曜-

772 : htmlファイルデータをCSVデータにするプログラム - とろたまうどん さん


お返事ありがとうございます。
UNOパパさん探して下さりありがとうございます。
雪乃☆雫さんありがとうございます。
やってみます!
皆様本当にありがとうございました。


(編集パスワード送信)

子記事

親記事 (No.766)
返信した記事(元) (No.771)

この内容(No.772)に返信

この内容(No.772)をダウンロード

この内容(No.772)のテキスト表示


2019-11-08 15:06:01 -金 曜-

771 : Re:Re:Re:htmlファイルデータをCSVデータにするプログラム - 雪乃☆雫 さん


 UNOパパ さまの検索力がしゅごいです!w(゜o゜)w
 DLしてみました。ほんとに4000くらいあった!(*゜ロ゜)

 というわけで、こんな感じ?
#-----------------------------------------------
作業フォルダ=「data」
保存フォルダ=「csv」
保存フォルダのフォルダ作成。

ファイル一覧=作業フォルダのファイル列挙。  //ファイル列挙と反復で千でも四千でもっ
ファイル一覧を反復。
  対象の1文字左部分が数字か判定。  //全部数字じゃないファイルは違うっぽいので
  もし、そうならば、
    #---ファイルを開く----------
    対象を開く。データはそれ。
    
    #---データの加工(むりやりすぎ;)----------
    //休日部分の入れ子テーブルが邪魔なの
    データ=データの「<table border="0"><tr><td>」を空に置換。
    データ=データの「</table></td>」を空に置換。
    データ=データの「</b></font></td><td>」を空に置換。
    //colspan="4"を反映させてみたり。いるかな
    データを反復
     対象を「.*colspan="4".*</td><td」で正規表現マッチ。A=それ。
     A=Aの「</td><td」を「</td>」に置換。
     データ=データのAをA&「"","","",」に置換。

    #---TABLEを抜き出す----------
    データの「<table border="1" cellspacing="0" cellpadding="2"」から「</table>」まで範囲切り取る。
    表はそれ。表=表の改行を空に置換。
    
    #---CSV形式に整形----------
    表=表を「</tr>」で区切る。
    表=表の「<td>」を「"」に置換。
    表=表の「</td>」を「",」に置換。
    表=表の「<td」を「"<」に置換。
    表=表の「<br>」を「 」に置換。
    表=表のタグ削除。
    表=表の「&nbsp;」を空に置換。
    表=表の「  」を空に置換。
    
    #---保存----------
    保存ファイル=対象を「.csv」に拡張子変更。
    表を保存フォルダ&「/」&保存ファイルに保存。
    母艦のタイトルは回数。
終わる。
#-----------------------------------------------
 フォルダとかは環境に合わせて変えてね☆
 いきなり本当に4000とかやると、ベラボウに時間掛かるので、とりあえず2,3ファイルでお試しして、どんなもんだか確認してね。

(編集パスワード送信)

子記事

親記事 (No.766)
返信した記事(元) (No.770)

この内容(No.771)に返信

この内容(No.771)をダウンロード

この内容(No.771)のテキスト表示


2019-11-08 09:02:45 -金 曜-

770 : Re:Re:htmlファイルデータをCSVデータにするプログラム - UNOパパ さん


ファイル名とバスの時刻表ってのから検索した結果、多分これですね

https://data.city.kyoto.lg.jp/node/14556

↑京都市バスの時刻表みたいっす。

ここからzipファイルダウンロードすると、大量にデータ入ってました。そこの「274021.htm」
ファイルがおそらく写真のファイルです。


(編集パスワード送信)

子記事

親記事 (No.766)
返信した記事(元) (No.769)

この内容(No.770)に返信

この内容(No.770)をダウンロード

この内容(No.770)のテキスト表示


2019-11-08 07:46:34 -金 曜-

769 : Re:htmlファイルデータをCSVデータにするプログラム - 雪乃☆雫 さん


画像なんて見たってしようが無いよ。
どんなデータをどのようにしたいのかが具体的に分らないと、教えようがないですよ。
あのサンプルは、見当違いだった? 画像だけ見た感じはテーブルっぽく思えるんだけど。
それとも、自分でどうにも出来そうも無いって事?
とりあえず、データそのものか、そいつをDLできるURLを上げてちょ。
お返事ありがとうございます(´;ω;`)
データはバスの時刻表をダウンロードしたものです形式ファイルはHTML




(編集パスワード送信)

子記事

親記事 (No.766)
返信した記事(元) (No.768)

この内容(No.769)に返信

この内容(No.769)をダウンロード

この内容(No.769)のテキスト表示




2019-11-07 18:07:38 -木 曜-

768 : htmlファイルデータをCSVデータにするプログラム - とろたまうどん さん


お返事ありがとうございます(´;ω;`)
データはバスの時刻表をダウンロードしたものです形式ファイルはHTML



(編集パスワード送信)

子記事

親記事 (No.766)
返信した記事(元) (No.767)

この内容(No.768)に返信

この内容(No.768)をダウンロード

この内容(No.768)のテキスト表示

◎ 画像ファイル


最新に戻る < < < > > > 次へ




www.eznavi.net