CAD日記

AutoCAD,DXF,DWG,SXFなどCADのことから、仮想通貨や投資関係、PC関係、プログラミング、国内海外旅行情報など何でもござれ。@caddiary

ソフト開発

扱えるテキストファイルの最大行数は1億行

投稿日:

扱えるテキストファイルの行数の限界が1億行なのが秀丸エディター。その他⇒動作環境⇒環境にて、編集可能な最大行数が10万行~1億行で設定できる(32bitの場合は1000万行まで)。1億行のテキストファイルなんてそうそう目の当たりにしないけど、AutoCADの中間ファイル形式であるDXFなら十分ありえる。

以下、線分(LINE)を書く本数による行数とファイルサイズを表現してみる。
1万本、28.7万行、1.9MB
10万本、281万行、19MB
100万本、2800万行、188MB
200万本、5600万行、372MB
300万本、8400万行、556MB
このあたりが秀丸で開ける限界。
計算上は、線分357万本で1億行のテキストファイルになる。
DXFファイルは行数が多くなる特徴がある。グループコードとグループ名の2行がセットで、それがひたすら続いていく。実際に転記してみるとこんな感じ。こんなテキストファイルをテキストエディタで見たところで、閲覧性が低くてお話にならんけど、昔はこうやって内容確認して解釈しようとしていたもんだな。
0
SECTION
2
HEADER
9
$ACADVER
1
AC1014
9
$ACADMAINTVER
70
9
9
$DWGCODEPAGE
3
ANSI_932
9
・・・

秀丸エディタのえらいところは、とてもサイズが大きいファイルを開こうとした際、「ファイルの一部を開く」というダイアログが出てきて、読み込む範囲を指定できること。2.7GBのテキストファイルを開こうとしたら、こんな画面が出てきた。どの部分を読み込むかを決めることができる。もちろん全部読み込むこともできる。ファイルサイズが500MBを超えると出る傾向はつかんだ。

3年前に書いた「テキストファイルの最大行数」という記事が妙にアクセス数をかせいでいるので、その続編を書いてみた次第。

-ソフト開発

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

関連記事

no image

暗号

こんな本を買った。 『RSA 暗号技術の基礎からC++による実装まで』 ソフトの認証を行うのに、シリアル番号とパスワードを使いたいから。 シリアルは、一定の桁数のランダムな数値とする。 パスワードは、 …

PDFiumはPDFからテキスト抽出するのもちょー簡単

PDFiumを語るのに日本語はいらない。プログラマーはプログラム言語で語る。PDFiumの処理は、tryとfinallyのところだけを見てくれればよい。たったこれだけでPDFからテキストを抽出できるの …

no image

MultiByte と WideChar

文字コードは、やっかいなもの。 以下の2つの関数は、知ってるようでよく知らなかったって話。 MultiByteToWideChar( ) WideCharToMultiByte( ) UNIコードの変 …

no image

プロパティシート

ソフト開発の話です。 私はVC6でソフトを作ってます。 ダイアログボックスの作りこみは、おもしろいものです。 プログラマーにとっては、デザイン的センスを問われる分野ですかね。 プロパティシートとは、ペ …

PDFアレコレはiTextSharp7も組み込むことにする

PDFiumViewerを使ってPDFアレコレという名のフリーソフトを作ってみたわけだが、PDFiumViewerの限界が見えてきた。