Numberland - New Processes, New Materials

GermanAfrikaansArabicBelarusianBulgarianChinese (Simplified)CzechDanishDutchEnglishEstonianFilipinoFinnishFrenchGreekHebrewHindiHungarianIndonesianItalianJapaneseKoreanLatvianLithuanianMalayNorwegianPersianPolishPortugueseRussianSlovakSpanishSwedishThaiTurkishVietnamese
  • Wer wir sind

    Wir sind - seit 1996 - als Ingenieurbüro auf dem Werkstoffsektor aktiv. Dabei verbinden wir Themen wie Innovations- Wissens- und Technologiemanagement mit sehr guten Kontakten zu Wissenschaft und Wirtschaft ...
    +Read More
  • Your man in Germany

                Your man in Germany Need a partner in Germany to get in contact with German institutions or companies? Are you tired of long distance phone calls or expensive trips from abroad with no or little results? Read more ...
    +Read More
  • Neue Werkstoffe

    Wir übersetzen technische Anforderungen in physikalische Effekte oder Eigenschaften, und finden dann den dazu passenden Werkstoff ... We translate technical demands intophysical effects or properties, andthen find the suitable material ...    
    +Read More
  • Neue Prozesse

    Wir analysieren, optimieren und dokumentieren Prozesse, die oft nicht im QM-Handbuch stehen,und bringen ihnen das Laufen bei ... We analyse, optimize and document processesoften not covered by quality management handbooks, and teach them to run ...
    +Read More
  • Leistungen

    Wir finden neue Werkstoffe, Bauteile, Herstellungs- und Analytikverfahren, Projektpartner, Entwickler oder Forschungseinrichtungen, Know-how oder Geräte, etc. Damit all diese neuen Erkenntnisse dann bei Ihnen auch effektiv eingesetzt werden können, helfen wir Ihnen, Ihr Wissen besser zu erfassen, Prozesse zu optimieren, F&E-Projekte durchzuführen, technische Angebote zu beurteilen oder Lastenhefte zu erstellen.  
    +Read More
  • 1
  • 2
  • 3
  • 4
  • 5

NumberlandTechnologyNews available in English und auf Deutsch

Publish Offers and Requests for free

This month offers and requests from the materials sector

We publish your materials conference

State of the Art over Night / Über Nacht zum Stand der Technik

 

In the course of further analysis all documents
  • will be separated into single words
  • stop words (=meaningless words) will be removed
  • stemming will be executed
  • relative importance of a word will be computed (for a certain document as well as for the whole collection)
  • as a result a matrix will be build up containing one line for each document and one column for each word. Each cell of the matrix contains a number which is a measure for the importance of the selected word within a certain document
  • Importance of documents as well as importance of words are expressed with numbers so that you are able to calculate with documents and words.

 

Im weiteren Verlauf der Analyse werden alle Dokumente des Korpus

  • automatisch in einzelne Worte zerlegt, wobei
  • bedeutungslose Worte entfernt, und
  • alle Worte auf ihre Stammformen reduziert werden (hinter Automat, automatisch, automatischer, automatisches, etc. steckt immer der selbe Sinn). Anschließend wird für jedes Wort
  • berechnet: wie groß ist die Bedeutung des Wortes sowohl für das einzelne Dokument, als auch für die gesamte Kollektion.
  • Als Ergebnis entsteht eine Matrix, die so viele Zeilen enthält, wie Dokumente im Korpus vorhanden sind, und so viele Spalten (im Korpus) wie Worte besitzt. Jede Zelle der Matrix enthält die Bedeutung eines bestimmten Wortes für ein ausgesuchtes Dokument.
  • Sowohl die Bedeutung der Dokumente, als auch die Bedeutung einzelner Worte wird als Zahl ausgedrückt, so dass man damit rechnen kann.

 

DocumentAnalysis-04

 

Figure 4: Feature matrix of a document collection. There is a line for each document in the collection; first column contains document names (patent number in this case). Beginning with the second column there is a column for each word in the collection (after stop words have been removed, about 3000 words in this case). The matrix cells contain values which are a measure of the relative importance of this word in the document.Bild 4: Eigenschaftsmatrix der Dokumentkollektion. Jede Zeile steht für ein Dokument, der Dokumentname (hier: Patentnummer) steht in der ersten Spalte. Ab der zweiten Spalte folgen so viele Spalten, wie Worte in der Dokumentkollektion enthalten sind, nachdem alle überflüssigen Worte entfernt worden sind (in diesem Beispiel ca. 3000). In den Zellen der Matrix steht ein Zahl als Maß für die relative Häufigkeit des betreffenden Wortes im Dokument.