CAD日記

AutoCAD,DXF,DWG,SXFなどCADのことから、仮想通貨や投資関係、PC関係、プログラミング、国内海外旅行情報など何でもござれ。@caddiary

コンピュータ全般

PDFのレイヤ情報を取得する方法

投稿日:

PDFにはレイヤというやっかいな構造があって、非表示のレイヤが印刷されてしまったり、表示されてしまったりという問題をここで報告した。イラレ、フォトショ、CADデータには当たり前にレイヤという構造があるもんだから、電子ペーパーのデファクトスタンダードたるPDFにもレイヤができたのだろう。

本題のPDFのレイヤ情報を取得する方法。
iTextSharpはPDFを書き出すのが得意。読み込むことも一応できるけれども、ページを回転させたり、他のPDFと結合するなんていうファイル全体に関わることができる程度。PDF内のオブジェクト情報(レイヤ、ベクトル情報、文字など)を取得するのはできない。と誰もが思い込んでいるが、実際はできる。PDFの構造を理解した上で、iTextShrapのAPIを駆使すればできるってことを知人が証明してくれた。

以下、PDFからレイヤ情報を取得する方法の概要。
・PdfReaderでPDFファイルを開く
・Optional Content Propertiesを得る
・PDFDictionaryの関節参照からレイヤ情報を得る
・レイヤ以外の情報もあるのでスキップする
 ディクショナリー以外
 タイプがOptional Content Group以外
 名前がない
・名前、表示ON/OFF、表示順番を取得して配列変数に格納

なんてことをソースコードから読み取った。おいらがC#をよく知らんということもあるが、それにしたってなかなか難解なコードだった。アラフィフオヤジが急にプログラムをやってみようったって、一朝一夕にはいかんってことがよくわかりけり。ニッチな目的ではあるが、いつかこれが日の目を見る日があることだろう。

-コンピュータ全般

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

関連記事

no image

やけに安いなと思ったメモリーはサーバー用だったが使い道が見つかりよかったなぁ

ヤフオクで落札したのは以下のもので5000円と格安だった。デスクトップにメモリー増設する目的だった。 Micron デスクトップ型 メモリー DDR3-1600 PC3-12800R 合計16GB 1 …

no image

押下

おうか、と読むそうです。 例:OKボタンを押下する。 一応、おうかと入力して漢字変換すると、押下が出てきます。 昔の操作マニュアルを読んでいたら、出てきました。 たまに出てくる単語ですが、頭の中では「 …

no image

PCの時刻

PCの時刻はたいへんいい加減だ。 1日に1分や2分平気で遅れる。 Windowsにはインターネット時刻というのがあって、 NTPサーバーから正確な時刻を取得することができる。 しかし、デフォルトのti …

no image

電流と電圧

12V2Aという仕様のものに、3.3V1.2Aのものを使ってた。 それが敗因であり、そのために数時間の無駄な時間を費やしてしまった。 ACアダプタの話。 妻の新しいPCを購入して、古いPCからのデータ …

no image

niftyのメールアドレスはもう使わないと決意したがこれがなかなかたいへんだ

2008年にこんな記事を書いていた。10年後の今でもメインのメールアドレスとしてniftyを使っていたが、ここらで本気で移行しようと決意した。gmailに移行する。当時もgmailはあったがフリーメー …