
データ:ラージハドロンコライダー用紙16ページ、ここで画像はベクトル化されます(通常は.eps)。答えを確認しています。ここスレッドチャートからデータを掻き取るために必要なソフトウェア。 PDFファイルから.eps画像を抽出するツールが見つかりません。私のシステム全体の疑似コード
- 通過する
gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=newfile.pdf badfile.pdf
(源泉) - PDFファイルからベクトル化された画像を抽出するための元の解像度を見つけます。 (スケーリングは不要なので、これについては不明です。Adobeビューの100%ズームレベルはスクリーンショットではうまく機能しません。)
- PDFファイルからベクトル化された画像を抽出する(現在の目標)
- .eps イメージからグラフィックを抽出
これらすべてを1つのシステムで行うとよいでしょう。
(3)を使ってツールを開きます。
可能な画像形式 png/xpm/jpeg/tiff/pnm/ras/bmp/gif
g3data
しかし、.eps形式はありません。- Engaudeデジタイザが有効になっています。ここ、そしてより人気があります
R digitize
。 R digitize
削除された時間ドゥルミ、管理者権限がないので、今はtpoisotのGithubにいます。ここそしてLukeのブログコメントDigitizeを使用して前の図面のデータをデジタル化します。しかし、彼らはCRANに戻ろうとします。ここチケット。ソフトウェアの使用中に一連の問題が発生しました。ここ。大きな弱点は、彼らが自分のgithubを感じ、どんなフィードバックも歓迎しないということです。
(3)と(4)を含むシステム
- おそらく、次の2つのことができるRパッケージがあります。
(3)または(4)のみのツールまたはツールなしのツール
- タスク(4)は、以下のようにMathematicaで実行できます。ここ~についてMathematicaで生成されていないEPSプロットからデータを抽出できますか?。しかし、devtalkによると、Mathematicaは(3)操作には適していません。
- Adobe Acrobat > 編集。これを行うのに適した方法が見つかりません。 Ubuntu 16.04にはLinuxバージョンがないようです。
ベクトル化とステップ(1-2)で
ここではグラフィックをドラッグアンドドロップできません。したがって、プログラムでPDFからグラフィックを抽出する必要があります。ドキュメントからすべての画像/eps/...を抽出できるターミナルツールがありますが、その機能がどれほどうまく機能するかはわかりません。ここでは、pdfファイルから.eps画像を抽出するのに適したものを見つけたいと思います。
ラスター化からベクトル化までのステップ(1-2)
ディスカッションのためにDavidLeBauerによって提供されたx軸と交差するグラフの画像例ここ
Davidの2番目の例は、2つの軸が交差する点に関するものです。
パスワード
% https://unix.stackexchange.com/q/281211/16920
gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=data_clean.pdf badfile.pdf
% drag and drop picture from data_clean.pdf to your folder in Ubuntu 16.04 by having the default zoom level; I think zoom should not affect here the result of drag-and-drop
% Result: image.png
% g3data image.png
% bug in 16.04: http://askubuntu.com/q/767982/25388
% open figure in ubuntu - Print to File > Ps.
% Result: image.png.ps
ps2eps image.png.ps
% Result: image.png.eps
% https://mathematica.stackexchange.com/q/85320/9815
%% Mathematica starts here
(* Wolfram Language Test file *)
fig = Import["image.png.eps"]
Import["http://raw.github.com/AlexeyPopkov/shortInputForm/master/shortInputForm.m"]
fig // shortInputForm
% Run but get error: http://askubuntu.com/q/767992/25388
% NB this error comes too if I have no code in the editor. So something wrong in my way of doing this. I am amateur in Mathematica.
Unixの方法でpdfファイルから.eps画像とそのグラフィックを抽出するには?
答え1
問題は実際には難しい逆問題であるため、この状況に対して適切にサポートされているソリューションはありません。 Mathematica ソリューションには実用的な問題もたくさんあります。
答え2
実際、元の質問に答えたかどうかはわかりません。
インクスケープベクトル情報を保持しながら、.pdfからページをインポートできます。その後、.svg形式で保存できます。
read.svgパス/ドット座標を抽出するには、ファイルを使用できます。ただし、画像座標を返すには、いくつかの調整(デフォルトではサイズ変更とオフセット)を実行する必要があります。
.svgファイルを読み、それに基づいてPythonコードを書こうとしています。svgフォーマット定義。しかし、開発中なので、曲線と軸だけを残す前にクリーンアップが必要です。