申し訳ありませんが、申し訳ありません。しかし、それはまさにその内容です...
一般化する
私が使用しているコンピュータはDebianを実行しています。レンダリングしたい臨床文書アーキテクチャ (CDA)文書をPDFに変換して添付ファイルとして送信します。 Chromeが完全に失敗しました。 Firefoxほぼうまく動作し、xmlto
TeXが欲しい(これまでこのボックスにTeXをインストールするのは問題でした)。代替案はありますか?
詳細
CDA ドキュメントは、基本的にzip
XML、スタイル、イメージを含む編集ファイルツリーです。私の場合、ファイルツリーは次のようになりました。
$ find | sort # edited for brevity and PII
.
./MachineReadable_XDMFormat
./MachineReadable_XDMFormat/HTML
./MachineReadable_XDMFormat/HTML/IMAGES
# list of PNGs omitted
./MachineReadable_XDMFormat/HTML/STYLE
./MachineReadable_XDMFormat/HTML/STYLE/colors.css
./MachineReadable_XDMFormat/HTML/STYLE/main.css
./MachineReadable_XDMFormat/IHE_XDM
./MachineReadable_XDMFormat/IHE_XDM/my_ID
./MachineReadable_XDMFormat/IHE_XDM/my_ID/DOC0001.XML # see note#=1
./MachineReadable_XDMFormat/IHE_XDM/my_ID/METADATA.XML
./MachineReadable_XDMFormat/IHE_XDM/my_ID/STYLE.XSL
./MachineReadable_XDMFormat/INDEX.HTM # see note#=2
./MachineReadable_XDMFormat/README.TXT # see note#=3
./MachineReadable_XDMFormat/Summary.pdf # see note#=4
メモ:
DOC0001.XML
データペイロードです。他のすべてのファイルは単なる装飾です。INDEX.HTM
レンダリングではありませんDOC0001.XML
。リンクを含む完全に別々のページですDOC0001.XML
。他。)といくつかの説明テキスト。README.TXT
それほど多くはありません。上記の情報とunzip
ファイルを作成する方法のみ説明されています。Summary.pdf
それでは、なぜ私の問題は解決しないのですか?残念ながら、このPDFではたくさん.../DOC0001.XML
(実際のデータを含む)には、消費者と関連のない項目が多く含まれているため、関連のない情報です。問題なくそのXMLを編集したり、編集したXMLをレンダリングしたりできますが(Firefox
以下のセクションを参照)、編集したXMLをPDFに変換することはできません。したがって、質問です。
試しましたが失敗しました
クロム合金
私はChrome(別名google-chrome-stable
)バージョン= 60.0.3112.90(現在はDebianバージョン= 8.9だと思い、現在はDebianの安定版だと思います)を持っています。私がするとき
Ctrl-o
- 正規化されたパスを提供します。
.../MachineReadable_XDMFormat/IHE_XDM/my_ID/DOC0001.XML
Chromeは何もしません。エラーはありませんが、完全に空白のページ/タブも表示されます。同様に、
Ctrl-o
- 正規化されたパスを提供します。
.../MachineReadable_XDMFormat/INDEX.HTM
- リンクをクリックしてください
DOC0001.XML
ChromeはINDEX.HTM
正しくレンダリングされますが、以前と同じように表示されますDOC0001.XML
。
Firefoxブラウザ
私のFirefoxバージョン= 54.0(現在のDebianバージョン= 8.9は最新バージョンだと思いますが、現在Debianは安定していると思います)。私がするとき
Ctrl-o
- 正規化されたパスを提供します。
.../MachineReadable_XDMFormat/IHE_XDM/my_ID/DOC0001.XML
Firefox はドキュメントを適切かつきれいにレンダリングします。だから私は一般的なFirefox機能を使ってこれを印刷できると思いましたが...かなり長い4ページを印刷しよPrint to File
うとしたので失敗しました。DOC0001.XML
- 最初はBunchaの短いセクションです。
- 2番目の項目にはheader =のみがあり、
Results
他のテキストはありません。 XMLには、<section>
すべての実際のデータ(sなど)が含まれます<item>
。 - 3回目の印刷試みみんな実際のデータ。残念ながら、1ページに印刷するデータはほとんどありません。状況を処理できず、個々の
Print to File
ページだけが切り捨てられます。:-(
- 4thにはいくつかのメタデータがあり、ほとんどの「情報」は
INDEX.HTM
。
xmlto
xmlto
(同じ名前のDebianパッケージで)試しましたが、
- FOを実行したいので、これにはローカルで問題になるTeXが必要です(
internal
以下のセクションを参照)。 xmlto
エラーメッセージ(下)と判断すると、この(CDA)文書のルートが∉なので、このXMLが正しくレンダリングされているかどうかはわかりません{appendix article bibliography book chapter colophon dedication glossary index part preface qandaset refentry reference sect1 section set setindex}
。
私が試したこと:
me@it:~ $ pushd /path/to/CDA/
me@it:/path/to/CDA $ ls -al
> drwxr-xr-x 4 me me 4096 Jul 21 10:38 MachineReadable_XDMFormat
> -rw-r--r-- 1 me me 1075851 Jul 21 13:35 Summary.pdf
me@it:/path/to/CDA $ date ; xmlto pdf ./MachineReadable_XDMFormat/IHE_XDM/my_ID/DOC0001.XML ; date
> Wed Aug 2 15:03:17 MST 2017
> xmlto: /path/to/CDA/MachineReadable_XDMFormat/IHE_XDM/my_ID/DOC0001.XML does not validate (status 3)
> xmlto: Fix document syntax or use --skip-validation option
> validity error : no DTD found!
...
me@it:/path/to/CDA $ date ; find ./ -type f | fgrep -ie 'dtd' | wcl
> Wed Aug 2 15:04:10 MST 2017
> 0
me@it:/path/to/CDA $ date ; xmlto --skip-validation pdf ./MachineReadable_XDMFormat/IHE_XDM/my_ID/DOC0001.XML ; date
> Wed Aug 2 15:04:32 MST 2017
> ERROR: Document root element for FO output must be one of the following elements: appendix article bibliography book chapter colophon dedication glossary index part preface qandaset refentry reference sect1 section set setindex
> PassiveTeX is needed for this format, but it is not installed. Please install the passivetex package.
> Wed Aug 2 15:04:33 MST 2017
# Note PassiveTeX is a *TeX package
me@it:/path/to/CDA $ date ; xmlto --with-fop --skip-validation pdf ./MachineReadable_XDMFormat/IHE_XDM/my_ID/DOC0001.XML ; date
> Wed Aug 2 15:12:39 MST 2017
> ERROR: Document root element for FO output must be one of the following elements: appendix article bibliography book chapter colophon dedication glossary index part preface qandaset refentry reference sect1 section set setindex
> [Fatal Error] :-1:-1: Premature end of file.
> Exception
> org.apache.fop.apps.FOPException: org.xml.sax.SAXParseException; Premature end of file.
> javax.xml.transform.TransformerException: org.xml.sax.SAXParseException; Premature end of file.
>
> /tmp/xmlto.SEzLdk
> Wed Aug 2 15:12:41 MST 2017
制限要因
外部
- Big Faceless OrgとそのCDA文書にエンコードされた情報がこれを提供します。 CDAは、その分野の情報交換のための標準形式で表示されるため、これは無理ではありません。
- CDA文書に情報をエンコードしたい人は、電子メールでファックスやPDFを使用できますが、それほど複雑ではありません。
- ファックスは利用できません。
内部
つまり、内側の制約は次のとおりです。
- 私はDebianバージョン= 8.9を使用しています...
- ...使用可能なディスク領域が不足しているボックスにあるか、ディスク領域が正しく割り当てられていない可能性があります。おおよその結果は...
...最後にインストールしようとしたときにスペースが不足しているため、
texlive
インストール(IIRC)が失敗しました。これは、パーティションではなく、すべてのパーティションのパーティションであるマイパーティション/
に割り当てられた領域が不足しているためです{/boot, /home, /swap}
。詳細:# I tweak the header, but the data comes from ... me@it:~ $ df --human-readable | fgrep -ve 'Filesystem' | sort --key=2 --reverse --sort=human-numeric Filesystem Size Used Avail Use% Mounted on /dev/mapper/LVM2_crypt-home 322G 304G 19G 95% /home /dev/dm-2 20G 18G 891M 96% / tmpfs 1.6G 1.3M 1.6G 1% /run/shm /dev/sda3 477M 73M 375M 17% /boot # ... rest are fake filesystems like `/dev` # Notes on `lsblk`: # `sda1` == pre-installed Windows system drive # `sda2` == pre-installed Windows apps drive # Both are whackable, but I lack the time to reallocate the space # (and possibly reinstall after unforeseen/disastrous failure). me@it:~ $ lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT sda 8:0 0 465.8G 0 disk ├─sda1 8:1 0 16.6G 0 part ├─sda2 8:2 0 97.7G 0 part ├─sda3 8:3 0 500M 0 part /boot └─sda5 8:5 0 351G 0 part └─LVM2_crypt 254:0 0 351G 0 crypt ├─LVM2_crypt-swap 254:1 0 3.9G 0 lvm ├─LVM2_crypt-root 254:2 0 20G 0 lvm / └─LVM2_crypt-home 254:3 0 327.1G 0 lvm /home sr0 11:0 1 1024M 0 rom