Archives : 4月-2022

Copu Full Textは、PDFなどのオフィス文書を連続オープンし、全てのテキスト情報をコピーしてExcelファイルにリスト化する自動プログラムです。文書をオープン→すべて選択→選択範囲をコピー→ペーストを繰り返し ..

Read more

OCR Selected Regionは、Copy Full Textと同様に、PDFなどのオフィス文書を連続オープンし、テキスト情報を取得してExcelファイルにリスト化する自動プログラムです。その違いは、OCR Se ..

Read more

Random Forestは、予め正解データを用意して学習させ、そのモデルを使って分類や予測を行うものです。教師あり学習の一つです。 モデルの作成(学習) ImportのFree Formatから、正解データをロードしま ..

Read more

Topic Detectionは、複数の文章をいくつかのトピックに分類し、各トピックをキーワードで表現してくれる機能です。オープンソースの機械学習ツールKNIMEと連携しています。現在のところ、英語のみが対象です。日本語 ..

Read more

Clusteringは、正解データを用意することなく、データを分類することができます。教師なし学習の一つです。 処理の実行 ImportのFree Formatでデータを展開します。量的データ(数値データ)は全て分析の対 ..

Read more

Link to NodeXL/NodeXL+の違い Link to NodeXL+は、Link to NodeXLと機能はほぼ同じですが、主に高速化とデータ連携を実現しています。データにもよりますが、概ね数千件を超えるデ ..

Read more

Force Layoutは、ネットワーク分析のブラウザ版です。操作が簡単かつ高速に描画できますが、ブラウザを使用するため、小規模のデータに限定されます。概ね、1000〜2000件を上限とし、これを超えるデータはLink ..

Read more

Graph ネットワーク図を手入力で簡単に作成できるブラウザツールです。右のウィンドウにテキスト入力すると、リアルタイムで描画されます。例えばAとBのつながりなら、A -> Bと入力します。 描画されたネットワーク図は、 ..

Read more

Google Search/News/Scholarは、いずれもGoogleで検索した任意の検索結果をリスト化する自動プログラムです。指定したページ分のタイトル、要約、出典、著者などの情報を自動取得し、Excelファイル ..

Read more

Morphologicalは、形態素解析による辞書作成支援と、その辞書に従って頻度テーブルを作成する機能が含まれています。頻度テーブルは、機械学習に使うことを想定しています。 辞書作成支援 Dataシートにデータを展開し ..

Read more