<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>smash-it.de &#187; Semantik</title>
	<atom:link href="http://www.smash-it.de/blog/tag/semantik/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.smash-it.de/blog</link>
	<description></description>
	<lastBuildDate>Wed, 02 Mar 2011 23:40:00 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.2</generator>
		<item>
		<title>Topic Map Tool</title>
		<link>http://www.smash-it.de/blog/2009/10/27/topic-map-tool/</link>
		<comments>http://www.smash-it.de/blog/2009/10/27/topic-map-tool/#comments</comments>
		<pubDate>Mon, 26 Oct 2009 23:27:00 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[java]]></category>
		<category><![CDATA[programmierung]]></category>
		<category><![CDATA[tools]]></category>
		<category><![CDATA[Semantik]]></category>
		<category><![CDATA[Topic Map]]></category>
		<category><![CDATA[Topic Map Tool]]></category>
		<category><![CDATA[TU Berlin]]></category>

		<guid isPermaLink="false">http://www.smash-it.de/blog/2009/10/topic-map-tool/</guid>
		<description><![CDATA[In diesem Artikel möchte ich kurz das Ergebnis von einem Projekt des letzten Semesters (Knowledge Networks and Semantic Technologies // SoSe2009 // TU Berlin) vorstellen. In dem Projekt ging es um die Analyse vorhandener E-Mails hinsichtlich der vorkommenden Themen und deren Verbreitung in dem E-Mail Netzwerk. Die Ausgangsdaten waren E-Mails vom Konkurs gegangenen US-Gas-Konzern Enron. [...]]]></description>
			<content:encoded><![CDATA[<p align="justify"><a href="http://www.smash-it.de/blog/wp-content/2009/10/TMT_Screenshot.jpg" class="liimagelink"><img style="border-bottom: 0px; border-left: 0px; margin: 0px 10px 10px 0px; display: inline; border-top: 0px; border-right: 0px" title="_TMT_Screenshot" border="0" alt="_TMT_Screenshot" align="left" src="http://www.smash-it.de/blog/wp-content/2009/10/TMT_Screenshot_thumb.jpg" width="171" height="171" /></a>In diesem Artikel möchte ich kurz das Ergebnis von einem Projekt des letzten Semesters (Knowledge Networks and Semantic Technologies // SoSe2009 // TU Berlin) vorstellen. In dem Projekt ging es um die Analyse vorhandener E-Mails hinsichtlich der vorkommenden Themen und deren Verbreitung in dem E-Mail Netzwerk. Die Ausgangsdaten waren E-Mails vom Konkurs gegangenen US-Gas-Konzern Enron. Uns lagen knapp 70 000 Mails vor, die das entstandene Topic Map Tool auf interessante Themen untersucht und die Korrelationen von Keywords berechnet. Um wirklich interessante Themen im nicht standardisierten E-Mail Verkehr zu identifizieren, kamen <a href="http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Pattern.html" title="Regular Expressions" target="_blank" class="liexternal">Regular Expressions</a>, Stopword-Listen sowie die <a href="http://lyle.smu.edu/~tspell/jaws/index.html" title="Java API for Wordnet Searching" target="_blank" class="liexternal">Wordnet-Searching-API</a> zum Einsatz. Mit diesen Technologien wurden relevante Keywords aus den E-Mails gesammelt und deren Korrelationen zu anderen relevanten Keywords berechnet. Ein wichtiger Faktor für die Berechnung ist, wie häufig zwei korrelierte Wörter zusammen in einer E-Mail auftauchen. Mit Hilfe von Wordnet konnten semantisch gleiche Wörter zu Clustern zusammengefasst oder gefiltert werden. Ebenso half <a href="http://wordnet.princeton.edu/wordnet/" title="Wordnet" target="_blank" class="liexternal">Wordnet</a> bei einer Filterung nach Wortarten, da vor allem Substantive interessante Schlüsselwörter sind. </p>
<p align="justify">Das Ergebnis der Analyse war ein Datenbank Dump, der im <a href="http://www.commetrix.de/" title="Commetrix" target="_blank" class="liexternal">Commetrix</a> Schema gespeichert wurde. So konnten die Ergebnisse mit Hilfe von <a href="http://www.commetrix.de/" title="Commetrix" target="_blank" class="liexternal">Commetrix</a> visualisiert werden. Die Ergebnisse seht Ihr auf den Screenshots weiter unten.</p>
<p align="justify">Exemplarisch starke Korrelationen bestanden zum Beispiel zwischen den Worten Gas und Price sowie zwischen President und Election. Unzählige weiter Beispiele könnte ich an dieser Stelle auflisten. Zusammenfassend hat die Lehrveranstaltung sehr viel Spaß gemacht und mich für das Thema semantische Netze begeistert. </p>
<h3>&#160;</h3>
<h3>Screenshot der Anwendung</h3>
<p>&#160;</p>
<p><a href="http://www.smash-it.de/blog/wp-content/2009/10/image1.png" class="liimagelink"><img style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" border="0" alt="image" src="http://www.smash-it.de/blog/wp-content/2009/10/image_thumb1.png" width="542" height="443" /></a></p>
<h3><a href="http://wordnet.princeton.edu/wordnet/" class="liexternal"></a></h3>
<ul>
<h3>Screenshots der visualisierten Topic Map</h3>
<p>&#160;</p>
<p>   <a href="http://www.smash-it.de/blog/wp-content/2009/10/TMT_Screenshot05.jpg" class="liimagelink"><img style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="TMT_Screenshot05" border="0" alt="TMT_Screenshot05" src="http://www.smash-it.de/blog/wp-content/2009/10/TMT_Screenshot05_thumb.jpg" width="244" height="244" /></a> <a href="http://www.smash-it.de/blog/wp-content/2009/10/TMT_Screenshot03.jpg" class="liimagelink"><img style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="TMT_Screenshot03" border="0" alt="TMT_Screenshot03" src="http://www.smash-it.de/blog/wp-content/2009/10/TMT_Screenshot03_thumb.jpg" width="244" height="244" /></a> </ul>
]]></content:encoded>
			<wfw:commentRss>http://www.smash-it.de/blog/2009/10/27/topic-map-tool/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

<!-- Performance optimized by W3 Total Cache. Learn more: http://www.w3-edge.com/wordpress-plugins/


Served from: www.smash-it.de @ 2012-02-05 03:25:17 -->
