そもそもコピペチェッカーとDIFFでは目的が異なる
差分の比較を行うソフトと言えばDIFFです。
オンラインで利用可能なDIFFソフトは沢山あります。
- https://tool-taro.com/diff/
- https://mergely.com/
- https://www.diffchecker.com/
- https://lab.hidetake.org/diff/
- https://www.en-pc.jp/tech/diff.php
これらのソフトとコピペチェッカーの違いを説明します。
まずコピペチェッカーは差分を調べるためのソフトではありません。コピペが存在しないかを調べるためのソフトになります。
この大前提により利用するソフトの性質も考えなければなりません。
まずDIFFを行うソフトは比較対象が、もともと同じで、少し差異があるなかで、その違いを調べることが目的です。しかしコピペチェッカはーは違います。
コピペチェッカーは比較対象の文書が同じ内容なのか否かもわからない状態から、差分がある点を調べるのではなく、似ている箇所が無いかを調べるための物です。
このため、ソフトウェアがとらなければならないアルゴリズムが大きく異なるのです。
まず、DIFFソフトですが、それぞれの比較対象文書が、基本的には同一の文章であることが前提となります。
そのため、自らの文書と等しい行が存在する箇所を調べて差分をつぶしていく挙動になります。これに対して剽窃を見つけるコピペチェッカーは文章内でよく使われている言葉や表現を探しそれぞれの文章でどの程度利用されているかなどを調べていかなければなりません。
DIFFソフトは文章同士が等しいことが前提で、その中に発生した差異を調べることが目的ですが、コピペチェッカーは存在するかどうかもわからない類似ひょうんげを探すことがスタートになりますので、システムにかかる負荷は非常に大きなものとなります。
また、英語と異なり日本語は世界でもまれにみる難しい言語で文章の切れ目に関して判定が非常に難しいです。※英語の場合は単語と単語の境目でわかれるが、日本語はそのような物が無い。
例えばプログラムのソースコードに関して違いを見つけるのであればDIFF系ソフトが向いています。コピペチェッカーはこのような用途には向いていません。しかし、文書同士で同じ(ような)表現が利用されていないかを調べるのであればDIFF系ソフトは向いていません。なぜならDIFFが基本が同じことが前提となっているうえでの、差分比較ソフトだからです。文章のように倒置法や愛おしい・恋しい等同じことを異なる表現できる文章では検出が難しくなります。
目的に合ったツールを利用するようにしましょう。
無料で利用できるコピペチェッカー
コピペチェッカーは無料で利用できる剽窃(盗用)を確認する事ができるオンラインツールです。
以下の組み合わせで自由にチェックする事ができます。
- ウエブサイト
- テキスト文書
- 張り付けた文書
コピペチェッカーを利用すると、どの場所が似ていたのかを視覚的に把握する事ができます。
コピペだとあらぬ疑いをかけられて調べてみたら、「おはようございます。こんばんわ」などよく使う言葉が一致していただけで、あらぬ疑いをかけられたことは無いでしょうか。
コピペチェッカーの判定は少し厳しめで、疑い前提でチェックします。その代わり、短すぎる言葉などはチェック対象外にしておりますので、引っ掛かる場合は「怪しい」と思ってください。
「コピペになってないよね?」という心配を払拭するために利用するよりは「コピペしましたよね?」と疑い前提で利用する場合に向いています。
コメント