FLAIRS 2010 - Augmenting n-gram Based Authorship Attribution With Neural Networks

Co-authors: Michael Wollowski, and Maki Hirotani Abstract: While using statistical methods to determine authorship attribution is not a new idea and neural networks have been applied to a number of statistical problems, the two have not often been used together. We show that the use of articial neural networks, specically self-organizing maps, combined with n-grams provides a success rate on the order of previous work with purely statistical methods. Using a collection of documents including the works of Shakespeare, William Blake, and the King James Version of the Bible, we were able to demonstrate classication of documents into individual groups.

read more...


外国語を学ぶ

過去二年間、外国語を学びました。外国語が大好きですから、外国語を三つ勉強しました。高校の時は、ドイツ語勉強しました。そして大学でスペイン語と日本語を学びました。将来では、外国語を勉強したいと思います。そして、外国語は非常に興味深いです。言語の歴史と構造は一番興味深いです。

read more...


二匹猫

私の人生の間に多くの幸せなこと多くの悲しいことがありました。多くのことが私の猫を含みました。子供の時は「スポーチ」という猫がいました。ダルメシアンのように見えたからスポーチの名です。スポーチは一番いい猫です。私とベッドで眠ってもらりましたから。常にフワフワでした。一日子供の時は死まれました。悲しい日ですよ。

read more...


私の知ない場所

私は面白い知ない場所があります。場所は私の家の近くの森です。私のせんこうはコンピュータサイエンスですが、野生の場所が大好きです。二つを組み合わせ ることはできませんから、悲しいです。そして、私の家は二時間の距離ですから、あまり行きません。

read more...


AnnGram - nGrams vs Words

Overview

For another comparison, I’ve been looking for a way to replace the nGrams with another way of turning a document into a vector.  Based on word frequency instead of nGrams, I’ve run a number of tests to see how the accuracy and speed of the algorithm compares for the two.

nGrams

I still intend to look into why the Tragedy of Macbeth does not stay with the rest of Shakespeare’s plays.  I still believe that it is because portions of it were possible written by another author.

read more...


AnnGram vs k-means

Overview As a set of benchmarks to test whether or not the new AnnGram algorithm is actually working correctly, I’ve been trying to come up with different yet similar methods to compare it too. Primarily, there are two possibilities: Replace the nGram vectors with another form Process the nGrams using something other than Self-Organizing Maps I’m still looking through the related literature to decide if there is some way to use something other than the nGrams to feed into the SOM; however, I haven’t been having any luck.

read more...


Sandbox - It's Alive!

So I haven’t actually updated the Sandbox project for quite some time (December 9th I believe).  Since then, I’ve actually torn out the core of the code and rewritten it to actually be a game, rather than another clone of the general Falling Sand games.  Rather than explain in detail what I’ve done (I’ll get to that later), I’ll start with screenshots of the new version.

read more...


高校生の時とマーチングバンド

高校生の時、私の今の活動と高校の活動ことなりました。たとえば、毎日マーチングバンドがありました。マーチングバンドでは、トランペットやチューバやふきました。そして、ピアノをひきました。一年生と二年生の時トランペットをふきまして三年生の時チューバをふきましたて四年生の時ピアノをひきました。

read more...