Matheo Analyser


Cartographies et analyses statistiques d'information structurée.




Matheo Analyzer, logiciel flexible et maniable permet, à partir de données structurées pertinentes dans un domaine technologique, d’exploiter efficacement des volumes importants de données pour les convertir en information stratégique.



 

 

 

 

Généralités

 

Matheo Analyzer est un logiciel d’aide à la décision permettant de disposer de tableaux de bord, de cartographies, de synthèses et d’indicateurs générés à partir de larges ensembles d’informations.

 

Il est classiquement utilisé par les experts et les analystes sur des brevets et publications scientifiques pour cartographier les acteurs et les technologies, détecter des tendances, assurer une veille scientifique, stratégique, commerciale ou concurrentielle.

 

Matheo Analyzer travaille à partir d’un ensemble d’informations structurées provenant de grandes bases spécialisées (gratuites comme les brevets, Medline, ou payantes via des serveurs comme Questel-Orbit, Dialog, STN, ….) ou de bases de données internes à l'entreprise.

 

MA_schema_fonctionnement_

 

Les analyses réalisées par Matheo Analyzer apportent des éléments clé dans les activités telles que :

  • Positionnements technologiques des concurrents
  • Politiques d’innovation et d’investissement
  • Evaluation de la recherche
  • Tendances technologiques
  • Analyses des portefeuilles brevets
  • Détection des équipes de R&D et de recherche
  • Veille technologique, brevets, concurrentielle

Il est un outil indispensable pour les professionnels travaillant dans des secteurs d’activité pour lesquels la production d’information à analyser est importante et qui souhaitent néanmoins bénéficier d’une connaissance claire et fiable de ces informations.

 

Sécurité des informations

  • Stockage

Avec Matheo Analyzer, vos données sont stockées sur votre PC et non sur un serveur Internet sur lequel vous ne maîtrisez pas la sécurité.

  • Confidentialité

Vos recherches (questions et résultats) ne transitent jamais par un prestataire externe. Vous gardez la maîtrise de votre information.

  • Matheo Software n’a jamais accès aux données et aux requêtes de ses clients.

 
Fonctionnalités

Importation des informations

  • Assistant d'importation

Matheo Analyzer permet l’importation de tous fichiers structurés (format bibliographique, fichiers CSV, …) issus de bases de données privées ou publiques (Esp@cenet, PubMed, Questel-Orbit, Dialog, STN, …) grâce à un assistant simple et performant qui propose de définir le type de fichiers et de champs à importer.

 

  • Possibilité d’utiliser des règles pré-établies d’importation

Pour l’importation de fichiers issus d’une même source de données, Matheo Analyzer propose l’utilisation de règles pré-établies d’importation qui vous permet de simplifier l’étape d’importation de données.

Les experts Matheo peuvent réaliser des règles d'importation sur mesure. (en savoir plus >)

 

  • Extraction fine d'information

Matheo Analyzer permet d’extraire facilement, à l’intérieur d’un champ multi-forme ou multi-information, la ou les informations particulières pertinentes.

Exemple : sélection de la partie Pays dans un champ Adresse

 

  • Import des brevets issus d' Esp@ceNet via Matheo Patent

Matheo Analyzer permet l'importation simple et rapide de tous fichiers d'exportation issus du logiciel Matheo Patent.

 

Préparation des données

  • Création de sous-ensembles de données

Matheo Analyzer permet la création de sous-ensembles grâce à des outils de sélection de l'information pour réaliser des analyses fines sur des sous-ensembles de données.

Exemple : sous-ensemble par Pays, Ville, Technologie, ...

 

  • Nettoyage automatique et correction des données importées

Matheo Analyzer permet d'uniformiser des données a travers l'utilisation de tables de correspondance, outils de recherche, de sélection et de modification des données.

 

  • Extraction de concept

Matheo Analyzer propose des outils permettant le traitement des textes libres (titres, résumés, ...) à travers l'extraction automatique de concepts et de mots-clés contenus dans les données.

 

Représentations graphiques, cartographies

Les cartographies, analyses et indicateurs se basent sur des ensembles de représentations graphiques permettant des syntèses, des analyses visuelles et des mises en correspondances entre informations. Ces représentations graphiques créent des informations à forte valeur ajoutée sur lesquelles vont pouvoir s'appuyer les décisions des entreprises.

 

Matheo Analyzer propose trois types de représentations graphiques :

  • Histogrammes (horizontaux, verticaux, pie charts)
  • Matrices à double entrée
  • Réseaux de relations

Ces représentations s'appliquent à un ou plusieurs critères simultanément tels que les technologies, les dates, les sociétés, les auteurs, ...

 

Il est possible d'intégrer un paramètre supplémentaire dans les représentations à travers l'insertion d'élements bloquants (une technologie, une entreprise, ...)

 

Clustering

Matheo Analyzer propose plusieurs méthodes de clustering automatique afin de pouvoir créer rapidement et facilement des sous-ensembles d'information.

 

Le clustering permet de disposer très rapidement d'une classification dynamique de volumes importants de données dans laquelle l'utilisateur peut naviguer facilement.

 

Matheo Analyzer permet la création facile et rapide de clusters par la sélection de quelques paramètres seulement. Il suffit simplement de choisir le domaine à utiliser comme référence et de sélectionner le nombre définitif de clusters à créer.

Matheo Analyzer permet également la création de sous-groupes pour des clusters intégrant un volume important de données.

 

Matheo Analyzer propose différentes méthodes de clustering :

  • K-Means++
  • Par propagation
  • Par dendrogramme


 
Nouveautés 4.0

Importation

  • Nouvelle méthode d'importation: "Extraction Académique"

Principalement destinée aux champs Adresses et Affiliations, elle permet d'extraire des portions de chaîne bien précises afin de reconstruire une forme "normalisée".

Sa propre séquence peut être fabriquée suivant plusieurs critères: Université, Faculté, Institut, Hopital, Centre, Laboratoire, Departement, Email, Pays.

Exemple: la forme "CRRM, univ. Aix-Marseille III, Av. Escadrille Normandie, Marseille, France;" 

             donnera "Univ. Aix-Marseille III, France"

             par la sélection des critères Université et Pays


  • Amélioration de l'utilisation des régles d'importation
  • Amélioration de l'importation des fichiers CSV
    • Gestion de la première ligne si celle-ci contient le nom des champs
    • Gestion des champs avec "Text Qualifier" 
  • Ajout des paramètres: 
    • Type de Fichier (Brevet, Medical, Scientifique, Autres)
    • Type de champs (plusieurs types sont disponibles suivant le type de fichier source)
  • Ajout d'un bouton "Notices" dans le Step 5 de l'assistant d'importation
  • Extraction Lexical: Stemming - 16 langages supplémentaires

 

MyAnalyzer

L'identification des champs sélectionnés lors de la phase d'importation permet à Matheo Analyzer de proposer automatiquement des analyses pertinentes sous forme de tableaux, matrices ou graphes.

 

MA_myAnalyzer_

 

Des Widgets supplémentaires, comme un moteur de recherche interne Full-Text, un Web-Service Medline, Esp@cenet ou Google, sont aussi disponibles pour une navigation intuitives dans le corpus importé, des recherches de brevets, de notices médicales, etc...

 

Clustering

K-Means

  • Entrée: Simplification des paramètres
    • Champ d'origine permettant la clusterisation
    • Nombre maximal de classes à créer
    • Nombre de clusterisation (Répétitions)
  • Sortie:
    • Indice de qualité de la clusterisation
    • Nommage des classes avec les termes les plus pertinentes
    • Indice de qualité pour chaque classe
    • Indice de Singularité de la classe
    • Indice de Regroupement de la classe (Compacte ou pas)
    • Affichage des principaux termes de la classe avec leur pourcentage d'utilisation
  • A venir: Navigation dans la clusterisation à l'aide d'un graphique

 

HAC - Hierarchical Agglomerative Clustering (Dendrogramme)

Dans l'analyse de classification hiérarchique, les graphiques "Dendrogramme" sont utilisés pour visualiser la façon dont les clusters sont formées.

Grâce à un axe réprésentant un seuil qu'il déplace à volonté, l'utilisateur choisit graphiquement le nombre de classes qui va composer la clusterisation.

  • Entrée:
    • Champ d'origine permettant la clusterisation
  • Sortie:
    • Classes composant la clusterisation

Propagation

Basé sur le principe du chaînage, ce type de clusterisation est très utile pour connaître les regroupements d'auteurs.

  • Entrée:
    • Champ d'origine permettant la clusterisation
  • Sortie:
    • Classes composant la clusterisation

Autres améliorations

  • Création de fichiers backup avant et après ouverture d'un projet
  • Possibilité d'effacer un champ "Original"
  • Affichage d'informations concernant le champ
  • Création de champs par la méthode des Percentiles
  • Visualisation des notices: Mise en forme + surbrillance des champs importés
  • Visualisation en temps réel du nombre de formes répondant aux critères de recherche dans le Local Search Engine
  • Amélioration des affichages des différents graphes et matrices
  • Matrice: 
    • Affichage de la somme arithmétique des valeurs présentes dans les cellules
    • Ajustement de la taille des lignes et des colonnes
  • Chart: 
    • Possibilité de sauvegarde de template pour le design des graphiques
    • Possibilité d'archiver les graphes
    • Export vers Txt
    • Export vers Excel
  • A venir: Nouveau composant graphique pour la représentation des réseaux

 
My Analyzer

 

Matheo Analyzer propose MyAnalyzer, un tableau de bord personnalisable permettant d'afficher et de configurer les analyses les plus significatives.

 

MA_myAnalyzer_

 

A partir de la version 4.0 Matheo Analyzer possède une interface configurable.

 

Cette interface donne accès aux informations du projet en cours :

  • nombre de documents
  • type de document et nombre de champs importés
  • nombre de champs créés par l'utilisateur
  • détail du contenu des champs

Un menu de configuration propose l'ensemble des analyses possibles compte tenu des informations importées.

L'utilisateur utilise le menu pour sélectionner les analyses qu'il souhaite intégrer à son tableau de bord.

 

Le contenu de chaque analyse reste paramétrable à travers cette interface.

 

Le tableau de bord possède également un moteur de recherche sur le texte intégral des informations importées.

 

 
Applications

Analyse de publications scientifiques

Base de données source: PubMed (publications médicales)

Thème de la recherche: LCA (Ligament croisé antérieur) année 2008

Thème de l'analyse: acteurs du domaine et domaines associés au LCA

Documents analysés: 3099 publications scientifiques

 

Analyses présentées sur le tableau de bord MyAnalyzer:

  • Les principaux pays sur ce thème de recherche
  • Les auteurs les plus importants du domaine
  • Les domaines principaux associés au LCA
  • Les revues les plus utilisées dans ce domaine
 
LCA_
 
  • Les principales équipes de recherche (Réseau des auteurs principaux)

MA_app_LCA_network_AU_

 

Analyse de brevets

Base de données sources: Espacenet (via un export Matheo Patent)

Thème de la recherche: les Airbags

Thème de l'analyse: sociétés déposants sur ce thème, différentiation des stratégies de dépôts

Documents analysés: 461 brevets

 

Analyses présentées sur le tableau de bord MyAnalyzer:

  • Evolution des dépôts de brevets par année
  • Principaux déposants
  • Analyse des technologies principales (classification internationale des brevets - CIB)
 
Airbag_
 
  • Cartographie des stratégies de dépôts (Matrice Déposants / Codes CIB)
AirBag_Matrice_IPC_Applicant_
 
  • Evolution des technologies dans le temps (Matrice IPC / Date de publication)
AirBag_Matrice_IPC_PD_
 

Ces deux études dans des versions plus complètes sont disponibles en téléchargeant la version d'évaluation de Matheo Analyzer.


 
Vidéo

 

 


 
Captures écran

 

My Analyzer

MA_myAnalyzer_

 

Interface Matheo Analyzer

MA_ScreenShot_

 

Représentation des paires

MA_ScreenShot_Pairs_

 

Clustering

clustering 

 

 
Fiche Technique

Minimum System Configuration

  • OS: Windows 98, ME, 2k, XP, NT, Vista, Seven
  • CPU: 500MHz
  • Free Hard Disk Space: 400 MB
  • System RAM: 256 MB
  • Screen Resolution: 1024x768, 32-bit color
  • Internet: 256 Kbps