Index: [Article Count Order] [Thread]

Date:  Sat, 09 Dec 2006 18:47:22 +0900
From:  SUGITA IZUMI <izumi @ ab.mie-u.ac.jp>
Subject:  [drf 0105] Re: Wordファイル等からのPDF作成について

一橋大学・大川さま
DRFの皆さま

  杉田@三重大(PDFについてまったり勉強中)です。
 いつも大変お世話になっております。

 PDF作成につきましては、三重大でも仕様を詰めているところで、
 特に、今後受け入れる学位論文については、電子ファイルも一緒に
 寄贈していただいて、作業を楽にしたいと思っているところです。

 まだまだ勉強不足なのですが、以前他の大学の皆さまや先生方から
 ご教示いただいたことも含めて、まとめてみました。

 誤解・誤認・不勉強が多々あるかと思いますので、フォローをして
 いただければ幸いです。どうぞよろしくお願いいたします。

-------------------------------------------------------------
>「MS-WordファイルからPDF化する際に、
>Wordからプリントアウトした論文と、ページ数が異なったり、
>図表・画像等がずれてしまったりするので、
>むしろプリントアウトしたものをスキャニングする方がよい」

  PDF化の際に、プリンタで印刷した場合とレイアウトが違ってしまう、
 というご指摘ですね。

・PDF化をする際、どのようなアプリケーションを用いているか
・もとのWord文書作成時に、どのようなフォントを用いているか

 ということが関係するのかもしれません。

 三重大では現在 Adobe Acrobat 7.0 Professionalを利用しています。
 今のところ、少なくともWordに関してはPDF化してレイアウトがおかし
 くなった経験はありません。

 Word文書から直接PDF化するメリットにはいろいろあるようです。
 ・テキストでの検索が可能になる
 ・タグ情報(XML?)やメタデータ埋め込みが可能
 ・電子署名ができる
 ・改竄防止のためにセキュリティが施せる
 ・フォントの埋め込みができる。
 ※数式だと数式部分にフォント(Computer Modern)を埋め込む必要?
 ※言語によっては特殊なフォントの埋め込み必要?

 もちろん、メタデータを別途ちゃんと付与するのだし、シンプルなPDF
 (ダムPDFと言うらしい)で充分、という考え方もあると思いますが。
 PDFのマニュアル本に「大切なのはソースファイル」だとか、「アクセシ
 ビリティを向上させるためには」とか書いてあるのを見ると、付加価値は
 付けておきたいと思うのです。

 一旦プリンタで印刷してからスキャナを使用してPDF化する場合でも、ス
 キャン時にOCR(光学式文字認識)を適用すれば、検索可能なPDFファイル
 を作成できるようですし、OCR適用せずに画像のみ・テキスト情報無しの
 PDFでも、後からOCRソフトを使えば変換できますが、ものすごく、手間が
 掛かりますよね・・・。

>また、言語学を専門とされる教員からは、
>「UTF-8に対応といっても文字がたりない、
>結局外字を作ってプリントアウトして、
>印刷原稿としたり画像ファイルとして自分のホームページに載せている」

 ここまでくると、もう仕方ないかなぁという気がしますね。

 ということで、三重大の場合は
 ・標準的な作業は、直接WordファイルからPDF化。
 ・どうしても不都合が起こる場合は、印刷してからスキャナ。
 ということにするのかな、思います。
 
 実は、フォント埋め込み機能を備えたフリーのPDF文書作成ソフトなど、
 フリーソフトでもかなり高機能になってきているようなので、わざわざ
 高いアプリケーションを買わなくてもいいのかなぁと思っておりました。

例:PrimoPDF
http://www.forest.impress.co.jp/article/2004/03/26/primopdf.html

 しかしながら、今、DRFで話題になっている「論文への署名について
 (Re: フルテキストデータへの書誌事項書き込みについて)」を読んだり、
 一橋大の先生のご指摘を読むにつけ、高性能・多機能なソフトを使った
 ほうがよさそうだなと思いました。

 評議会における説明会で「著者最終稿(Wordと画像)を図書館で取って
 おいてもらえるなんて、ありがたい」という感想を述べられた教員(医)
 がいらっしゃって、「え、先生それは誤解です。正直そこまではできない
 です〜。」と思っていました。
#幸か不幸か、コメントする時間的余地はありませんでした。

 しかし、PDFも万能ではない(つまりIRに入れてくれたら半永久保存しま
 すという約束が果たせない可能性がある)ということを聞いて「やっぱり
 取っておきましょう」ということになりました。
#もちろん、PDFよりWordが先にダメになってしまう可能性大かもですが。

 村上先生から「長期保存用PDF/Aは仕様導入検討してもよさそうです。」
 というコメントもありましたね。
 http://www.antenna.co.jp/PDF/reference/PDFA.htm

 こんなので、参考になりましたでしょうか・・・?


情報推進課主査(図書館システム主担当) さんは書きました:
>一橋大学情報推進課の大川と申します。
>お世話になっております。
>自IR紹介につづき、標記の件に関しまして、お尋ねいたします。
>
>非常に初歩的かつ技術的な質問で恐縮に存じますが、
>MS-Wordなどのワープロソフトで作成された論文ファイルを
>PDF化してリポジトリに登録する作業をされている大学様、
>特に、博士論文をそのような方法で処理されている大学様にお尋ねいたします。
>
>学内に設置しました機関リポジトリWGにて、
>論文提供の方法を検討していましたところ、
>「MS-WordファイルからPDF化する際に、
>Wordからプリントアウトした論文と、ページ数が異なったり、
>図表・画像等がずれてしまったりするので、
>むしろプリントアウトしたものをスキャニングする方がよい」
>との指摘をうけました。
>また、言語学を専門とされる教員からは、
>「UTF-8に対応といっても文字がたりない、
>結局外字を作ってプリントアウトして、
>印刷原稿としたり画像ファイルとして自分のホームページに載せている」
>との声も上がり。
>
>論文中の別のページへの参照が含まれていたりすると、
>意味不明の参照になりかねません。
>文字が再現されないのも困ります。
>これはもうスキャンするしかないかと。
>出版された雑誌論文と異なり、博士論文のような場合、
>底本となる印刷物が流通しているわけでもありません。
>
>こうした事例にはどのように対応されているのでしょうか。
>
>==============================================================
> 大川明子  (一橋大学学術・図書部情報推進課主査(図書館システム主担当))
> inf-l @ ad.hit-u.ac.jp   Tel.042-580-8231   Fax.042-580-8232
>==============================================================
>
>

=================================================
Sugita Izumi 杉田いづみ  izumi @ ab.mie-u.ac.jp

国立大学法人三重大学 学術情報部(附属図書館)
情報図書館チーム 情報リテラシー担当

〒514-8507 三重県津市栗真町屋町1577 
Tel:059-231-9089 (ext.2208) Fax:059-231-9800
図書館Web:http://www.lib.mie-u.ac.jp/
問合先Email:literacy @ ab.mie-u.ac.jp