[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[drf:2502] Re: 紀要の電子版について
- Date: Thu, 16 Jun 2011 14:59:55 +0900
外崎様
さっそくのご回答ありがとうございます。
なるほど、ワープロ文書などから変換して最初から検索できるようになって
いるものも透明テキスト付きPDFとおっしゃっているわけですね。
細かい言葉の定義はどうでもいいようなものですが、
たとえば、
http://www.sophia-it.com/content/%E9%80%8F%E6%98%8E%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88
などの定義を読むと、透明テキストというのは画像PDFを検索可能にするため、
追加されたテキストのことを言うように感じられます。
ワープロから直接変換したPDFは、わざわざ透明テキストと呼ばれるようなもの
を付加するのではなく、本体(?)にテキストが含まれていると思っていたので
質問させていただいた次第です。
> 印刷業者が使用している最近の印刷業者用のシステム(ツール)ではこの機能
> (透明テキスト付きPDF出力)を標準で持つものが大半だと聞きました。
まったく根拠なく言ってますが、ひょっとして、問題になっているファイル
サイズが巨大になってしまうというのは、このあたりが関係しているという
ことはないでしょうか?つまり、印刷業者はわざわざ透明ファイル付き画像
PDFに変換してしまっているのではないか。。。
われわれがパソコンでワープロ等からPDFを作成する際は、多少カラー画像を
含んでいても、そんなに大きなサイズになりませんよね?むしろPDFにすると
小さくなる場合もあるくらいで。
栗山 正光
常磐大学人間科学部現代社会学科
〒310-8585 水戸市見和1-430-1
(2011/06/16 13:59), Library wrote:
> 栗山さま
>
> 関東学院の外崎です。
>
> すみません、表現が分かりにくかったでしょうか、補足します。
> PDFファイルには二種類の形状があります。
> 透明テキストが付与されたPDFと画像PDFです。
> 簡単に言ってしまえば、作成された電子ファイルからツールにより変換され
> た文字検索の可能なPDFファイルと画像から作られたPDFファイルという
> 2種類です。乱暴すぎる言い方かも・・・
>
>
> ◆透明テキスト付きPDFファイル
>
> ワードやエクセル、その他のツールで作成した文書を「Adobe Acrobat 」や
> 「いきなりPDF」などのソフトを用いてPDFファイルに変換することで、透明
> テキストが付与されたPDFファイルを作成することが可能です。
> この場合はtextデータがそのまま透明テキストに移行されるため誤読などが
> なく、特殊は記号以外は完全に切り出されます。
> 印刷業者が使用している最近の印刷業者用のシステム(ツール)ではこの機能
> (透明テキスト付きPDF出力)を標準で持つものが大半だと聞きました。
> 本学では印刷業者に「透明テキスト付きのPDF」と指定して、納品させており
> ます。(更に、目次データもエクセルで納品してもらいます)
>
>
> ◆画像PDFファイル
> スキャナにて取り込んだ画像より作成したPDFファイルです。複合機の印刷機能
> により出力されるPDFも画像PDFファイルです。
> 「Adobe Reader」で文字を検索することが出来ません。
> OCRにて透明テキスト付きのPDFファイルに変換することが可能ですが、精度
> は95%から98%程度です。
> (最近は複合機のスキャナ機能でもOCR機能を持つものがありますが、テスト
> した範囲では専用ソフトのほうが品質は高いです)
>
> 使用するOCRソフトにより特性もあります。詳しくは以下にて報告させていた
> だきました。(下記URL参照、※会員で無いと有償)
> http://ci.nii.ac.jp/naid/110008003341
> ※会員で無い方は、その一部を本学の図書館OPACおよび機関リポジトリにて
> 提供しています。
> ⇒ 市販のOCRソフトにて作成した透明テキストデータの調査
> http://library.kanto-gakuin.ac.jp/webopac/catdbl.do?pkey=NI90000004&initFlg=_RESULT_SET_NOTBIB
>
> 上記URLで表示されるOPAC検索結果画面より[本文を見る]をクリックして下
> さい。本文PDFにリンクいたします。
>
> ご参考になれば幸いです。
>
> On Thu, 16 Jun 2011 09:41:02 +0900
> Masamitsu Kuriyama<mtkuri @ xxxxxxxxxxxx> wrote:
>
>> 外崎様
>> 横から済みません。
>> 初歩的な質問なのですが、「透明テキスト」というのは、画像をOCRで
>> テキスト化したもののことですよね?
>> 最初からワープロで作られてテキスト・データがあるものは透明テキスト
>> とは言わないような気がするのですが、いかがでしょう?
>> 私もPDFに詳しくないのでご教示いただければ幸いです。
>>
>> 栗山 正光
>> 常磐大学人間科学部現代社会学科
>> 〒310-8585 水戸市見和1-430-1
>>
>> (2011/06/16 9:21), Library wrote:
>>> 土屋先生
>>>
>>> 関東学院の外崎です。
>>>
>>> 本学の場合は稼動当初(2003年度)より印刷業者に紀要冊子の納品時に
>>> デジタル版のPDFファイルを納品してもらっています。
>>> 印刷業者は最近は殆どがパソコン編集ですので、版下となる書式データ
>>> からPDF形式で出力してファイルを作成しています。その際に画像PDFと
>>> 透明テキスト付きPDFにする方法があるそうです。
>>> 最初は「透明テキスト付きのPDFファイル」という意味が伝わらず苦労
>>> しましたが、「検索可能なPDF」のことですと説明しておりました。
>>> 最近では印刷業者に「透明テキスト付きのPDFファイル」というだけで
>>> 提供されるようです。同じ「透明テキスト付きのPDFファイル」でも、
>>> 画像部分の解像度が高く高画質のPDFを要求するとファイルサイズは大
>>> きくなります。印刷に耐える画質であれば十分なのですが・・・。
>>>
>>> 補足のコメントをさせていただきました。
>>>
>>>
>>> On Wed, 15 Jun 2011 17:30:30 +0900 (JST)
>>> Syun Tutiya<tutiya @ xxxxxxxxxx> wrote:
>>>
>>>> 寺島さん
>>>>
>>>>> どのような電子版(pdf)を提出してほしいか,について,
>>>>> 基準とかガイドラインなどではありませんが,以前先生方に,
>>>>> リポジトリへの登録・公開の推進について
>>>>> 協力依頼の文書を出したときに,下記のような文をつけました。
>>>>> ご参考までにお知らせします。
>>>>
>>>> ちょっと気になったのですが、印刷屋さんには、印刷の版下になるデジタルな
>>>> PDFがあるのではないでしょうか。つまり、透明テキストなどなしに、検索可
>>>> 能なPDFファイルを納品させればいいだけのような気がするのですが、、、、
>>>> 印刷屋さんが、まさか印刷したあとのページイメージをスキャンしてOCRをつ
>>>> かって透明テキストを作るとは思えないので。
>>>>
>>>> 土屋
>>>>
>>>>
>>>>
>>>>
>>>> ──────────────────☆────────
>>>> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
>>>> 2011年6月号を発行しました!
>>>>
>>>> DRF(Digital Repository Federation)
>>>> http://drf.lib.hokudai.ac.jp/drf/
>>>> ─────★─────────────────────
>>>
>>> ---
>>> libraryi @ xxxxxxxxxxxxxxxxxx
>>>
>>>
>>>
>>>
>>>
>>> ──────────────────☆────────
>>> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
>>> 2011年6月号を発行しました!
>>>
>>> DRF(Digital Repository Federation)
>>> http://drf.lib.hokudai.ac.jp/drf/
>>> ─────★─────────────────────
>>>
>>
>>
>>
>>
>> ──────────────────☆────────
>> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
>> 2011年6月号を発行しました!
>>
>> DRF(Digital Repository Federation)
>> http://drf.lib.hokudai.ac.jp/drf/
>> ─────★─────────────────────
>
> ---
> libraryi @ xxxxxxxxxxxxxxxxxx
>
>
>
>
>
> ──────────────────☆────────
> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
> 2011年6月号を発行しました!
>
> DRF(Digital Repository Federation)
> http://drf.lib.hokudai.ac.jp/drf/
> ─────★─────────────────────
>
──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
2011年6月号を発行しました!
DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/
─────★─────────────────────