Infraestructura Científica de las Tecnologías de la Información y de las Comunicaciones
Xavier Polanco LIP6 CNRS/Univ. Pierre et Marie Curie – Paris 6 xavier.polanco@lip6.fr
Objetivo
• Manual de Lisboa (ML): el desarrollo de las tecnologías de la información y las comunicaciones (TICs) se encuentra a la base de la denominada “sociedad de la información”: “acceso y uso” • El objetivo: analizar y proponer indicadores acerca de la investigación científica (infraestructura científica) de donde se generan las TICs.
Cuestión/1
• Principio: versus • Ejemplo: el esfuerzo mayor en la investigación en curso busca conducir las TICs, tales como internet y la web, de la al , en el sentido que vamos a presentar.
Cuestión/2
• ¿Es posible en este campo prever desde la investigación científica cual será la nueva generación de TICs? • Con el fin de dar una respuesta a esta interrogación, proponemos un estudio de caso: la “web semántica” (2004-2005) a partir de la base de datos bibliográficos PASCAL (INIST/CNRS).
Metodología
Categorías Conceptos Red Densidad Centralidad
Intención/ Extensión
Nodos
Cohesión
Rol/ Importancia
Tablas
Redes G(N,R); N = g(n,r)
Extraccion de conocimientos
STANALYST
Publicaciones = materia prima
Datos
• 2004-2005
– 2004 – 2005
= 795 publicaciones
= 330 (41,5%) = 465 (58,5%)
• Muestra (2006) de 38 publicaciones • OBJETIVO: Pasar de esta información al conocimiento que ella representa acerca de la web semántica
Primera parte
Categorías
Densidad
Red
Centralidad Rol/ Importancia
Conceptos
Intención/ Extensión …
Cohesión
Nodos
Tablas
Redes G(N,R); N = g(n,r)
Extracción de conocimientos
STANALYST
Publicaciones = materia prima
Tabla de conocimientos (2004)
%
ONTOLOGY
102 7 6 4 4 1
%
SEMANTICS
43 40 22 8 6 3 3 1 1 1
%
KNOWLEDGE
175 21 14 1 1
53,03 Ontology 6,36 Description logic 4,24 Description language 0,30 Ontology mapping 0,30 Standard upper ontology
30,91 Semantics 2,12 Semantic network 1,82 Semantic analysis 1,21 Formal semantics 1,21 Semantic relation 0,30 Operational semantics
13,03 Knowledge base 12,12 Knowledge engineering 6,67 Knowledge representation 2,42 Knowledge acquisition 1,82 Knowledge management 0,91 Knowledge based systems 0,91 Knowledge discovery 0,30 Knowledge 0,30 Knowledge grid 0,30 Knowledge representation languages
%
REASONING
6 3 1 1 1 1 1 1
%
LEARNING
12 7 4 2 1 1 1 1
%
NATURAL LANGUAGE
8 6 4 2 1
2,42 Model-based reasoning 1,82 Case based reasoning 1,21 Automated reasoning 0,61 Temporal reasoning 0,30 Case-based reasoning
1,82 Learning algorithm 0,91 Machine learning 0,30 Inductive learning 0,30 Learning (artificial intelligence) 0,30 Learning object metadata 0,30 Probability learning 0,30 Reinforcement learning 0,30 Supervised learning
3,64 Natural language 2,12 Language processing 1,21 Linguistics 0,61 Natural language processing 0,30 Computational linguistics 0,30 Linguistic model 0,30 Structural linguistics 0,30 Language generation
Tabla de conocimientos (2005)
% 272 15 31 13
ONTOLOGY
187 11 9 5 4 3 1
%
SEMANTICS
43 42 24 10 10 4 1 1 1 1
%
KNOWLEDGE
58,50 Ontology 3,23 Ontology mapping 6,67 Description logic 2,80 Description language
40,22 Semantics 2,37 Semantic analysis 1,94 Formal semantics 1,08 Semantic network 0,86 Semantic relation 0,65 Operational semantics 0,22 Semantic memory
9,25 Knowledge base 9,03 Knowledge representation 5,16 Knowledge engineering 2,15 Knowledge discovery 2,15 Knowledge management 0,86 Knowledge acquisition 0,22 Knowledge 0,22 Knowledge based systems 0,22 Knowledge representation languages 0,22 Knowledge transfer %
% 8 3 2 2 1 1 1 1
REASONING
6 2 1 1 1
%
LEARNING
13 9 3 2
NATURAL LANGUAGE
1,72 Case based reasoning 0,65 Automated reasoning 0,43 Model-based reasoning 0,43 Temporal reasoning 0,22 Common-sense reasoning 0,22 Qualitative reasoning 0,22 Reasoning 0,22 Spatial reasoning
1,29 Learning algorithm 0,43 Inductive learning 0,22 Concept learning 0,22 Learning 0,22 Unsupervised learning
2,80 Natural language 1,94 Linguistics 0,65 Language family 0,43 Language class
Distribución en %
80 70
60
50
%
40
2004 2005
30
20
10
0 2004 2005
Ontology 64 71
Semantics 38 47
Knowledge 39 29
Reasoning 6 4
Learning 5 2
Natural L. 9 6
Segunda parte
Indicadores Categorías
Densidad
Red Cohesión
Centralidad Rol/ Importancia
Conceptos
Intención/ Extensión
Nodos
Tablas
Redes G(N,R); N = g(n,r)
Extracción de conocimientos
STANALYST
Publicaciones = materia prima
Muestra
38 artículos, fecha de publicación 2006 OBJETIVO: estructura (matriz) => red (representación en red)
ONTOLOGY SEMANTICS
3 3 3 3 2
%
%
%
KNOWLEDGE
18 2 2 1
44,74 Ontology 5,26 Description language 5,26 Description logic 2,63 Data description language
7 18,42 Semantics 3 7,90 Semantic analysis 1 2,63 Semantic network
7,90 Knowledge base 7,90 Knowledge engineering 7,90 Knowledge management 7,90 Knowledge representation 5,26 Knowledge acquisition
%
%
REASONING
%
LEARNING
NATURAL LANGUAGE
1 2,63 Automated reasoning 1 2,63 Case based reasoning
1 2,63 Concept learning 1 2,63 Machine learning
2 5,26 Linguistics 1 2,63 Linguistic tool
Matrices
Matriz de incidencia (o P categorías × N documentos)
C 1 C2 CP d1 d2 dN 1 0 1 1 1 0 Ci C j ; Ci C j d 0 1 1
1) Grafo de las categorías, G(N,R) N = {n} categorías R = {r} relaciones
Matriz de adjacencia (o P categorías × P categorías)
C1 C2 C 1 0 1 C2 1 0 CP 1 1 CP 1 1 r (Ci ,C j ) Ci C j ) d 0 0
2) Grafo de los conceptos internos a las categorías Gcat (n, r)
[1] ONTOLOGY [2] SEMANTICS [3] KNOWLEDGE [4] REASONING [5] LEARNING [6] NL
[1] ONTOLOGY [2] SEMANTICS [3] KNOWLEDGE [4] REASONING [5] LEARNING [6] NL 4 10 1 2 1 1 1 0 2 1 2 1 0 0 0
ONTOLOGY SEMANTICS KNOWLEDGE REASONING LEARNING NL
C(r) C(v) 5 18 4 8 5 15 4 3 2 4 3 4
Grafo: G(N,R) = G(6,11) N(N-1)/2 = 15 Densidad de G: R/N(N-1)/2 = 11/15 = 0,73
(1) (2)
(1) (1) (4)
Centralidad de un nodo i C(ni) = ∑r(ni); ∑v(ni) r(max): n-1 = 6-1 = 5
(1) (10)
Num. pub. 12 7 5 4 22 % 32 18 13 11 58 USA UK Germany Korea UE
(2)
(1)
(1)
(2)
(Java Graph Drawing)
[1] Ontology (0,33)*
[2] Semantics (0,33)
[3] Knowledge (0,20)
(1)
(2)
(2)
(2)
[4] Reasoning (0,00)
[5] Learning (0,00)
[6] Natural language (1,00)
(1)
* Densidad = R/N(N-1)/2
Índices
Asociación Inclusión
c(i ) c( j ) sup c(i ), c( j )
Estabilidad
Transformación
Categorías
A ij
c (i ) c ( j ) c (i ) c ( j )
2
I (ij )
c(i ) c( j ) I (ij ) inf c(i ), c( j )
E (hk )
2 e(h ) e(k ) e(h ) e(k )
T (hk ) 1 E (hk )
1
1 5 3 3
Conceptos
9
8 ?
8 5
9
Estructura
Tiempo, evolución
Conclusiones
• ¿Es posible en este campo prever desde la investigación científica cual será la nueva generación de TICs? • Indicadores e instrumentos para el análisis de redes de conocimiento • Estado de una situación científica • Preveer, pronosticar
17