論文のテキストデータをどのように保存するか。

検索元データを一つのテキストファイルにするのか,複数のテキストファイルにするのか,議論の別れる所だと思います。私は,1論文1ファイルに分割しています。その理由は,検索結果ウィンドウの右側には,どのファイル(どの論文)で使われた表現なのかが分かります。
ScienceDirectの場合,読みたい論文の画面で,多くの場合はPDFのボタンをクリックして,論文を表示させることが多いかと思いますが,そのメイン画面に論文の文字データが全てテキスト形式で書かれていますので,これらを全て選択すれば
以下の例は直近のJFEのものです。真ん中の領域にAbstract,Introductionとあります。(著作権などに気をつけて,ぼかした画面になっています。見難くて申し訳ありません。。)
PDFファイルをテキスト形式で抜き出すと,改行の位置などで不都合が起きることがあるかと思いますが,これだとその心配がほぼ解消されます。

雑誌出版社がOxford PressやWillyの場合は,論文選択画面中に"Full text (HTML)"というリンクがあり,それをクリックすれば,テキスト形式で表示されます。