Beobachtung und Beurteilung internationaler Forschungs- und Entwicklungsaktivitäten
mittels Häufigkeitsanalysen der weltweit größten bibliographischen Datenbanken
Zur Hauptgliederung

2.    Methoden des Analysierens von bibliographischen Online-Datenbanken

Seitengliederung
Analysegegenstand
Anwendungsbeispiele
Zusammenfassen von Datenbanken zu einem Cluster
Formen des Darstellens von Analyse-Ergebnissen
 
Analysegegenstand
 
 
Analysegegenstand sind die in den bibliographischen Online-Datenbanken enthaltenen Mengen von Publikationsnachweisen. In der Wissenschaftsmetrie ( engl. Scientometric ) werden bezüglich der Analysen von Publikationsmengen die Zitationsanalyse ( Analyse des Zitierverhaltens von Autoren ) und die Häufigkeitsanalyse unterschieden. Die hier beschriebene Methode bezieht sich ausschließlich auf Häufigkeitsanalysen.

Häufigkeitsanalysen von bibliographischen Datenbanken liefern ein quantitatives Maß für die Produktivität der Autoren eines Landes, einer Institution, einer Forschungsrichtung usw. Hierzu wird die Menge der in den führenden Datenbanken zu einer bestimmten Thematik gespeicherten Publikationsnachweise daraufhin untersucht, wie häufig zu  jeweils gleichen Beschreibungselementen der Publikationsnachweise gleichartige Aussagen ( z.B. gleiches Land des Autors ) vorliegen.

 
     Zu den für Häufigkeitsanalysen geeigneten Beschreibungselementen gehören insbesondere: 
  • Inhaltsbeschreibende Fachtermini eines vorgegebenen Vokabulars (Controlled Terms),
  • Hauptsachwörter aus dem Titel der Publikation,
  • Inhaltscharakterisierende Termini einer Fachklassifikation (Classification Codes)
  • Erscheinungsjahr der Publikation (Publication Year), 
  • Arbeitsstelle des Verfassers der Publikation (Corporate Source)
  • Art der Publikation (Document Type).
   Nicht oder wenig geeignet sind publikationsspezifische Beschreibungselemente wie z.B.:
  • der Autor / die Autoren der Publikation (Author),
  • der vollständige Titel der Publikation (Title).
   
                                                                                                       Zur Seitengliederung


Anwendungsbeispiele

 
Die nachfolgenden Beispiele enthalten praxisbezogene formalisierte Beschreibungen von Aufgabenstellungen für das Analysieren großer bibliographischer Online-Datenbanken.
Beispiel 1
Häufigkeiten ausgewählter Beschreibungselemente

Aufgabenstellung
Zur Thematik "Nanotechnologie"sind getrennt zu ermitteln: 
- die Publikationshäufigkeit im Jahr 1997;
- die Publikationshäufigkeit an Universitäten der USA;
- die Häufigkeit des Publikationstyps Forschungsberichte.

Beispiel 2
Kombinierte Aussagen durch Verknüpfen von Beschreibungselementen

Aufgabenstellung: Zu ermitteln ist die Häufigkeit von Publikationen zur Nanotechnologie, die 1997 an Universitäten der USA als Forschungsberichte erschienen sind.


 
Durch das Vergleichen von Publikationshäufigkeiten über bestimmte Zeiträume hinweg werden Veränderungen im Publikationsgeschehen erkennbar. Diese lassen sich als Häufigkeitsverläufe mit Excel oder einem anderen Computerprogramm grafisch darstellen.
Zusätzlich können durch das Einfügen von Trendlinien in die grafischen Darstellungen prognostische Aussagen zur Entwicklung der Publikationshäufigkeiten getroffen werden. Der Prognosezeitraum sollte hierbei nicht mehr als ein oder zwei Jahre umfassen.
Beispiel 3
Grafische Darstellung der Ergebnisse von Publikationshäufigkeitsanalysen. 

Aufgabenstellung: Getrennt nach Jahren und Publikationstypen sind die Häufigkeitsveränderungen bei den Publikationen zur Nanotechnologie, die von 1990 bis 1997
a) an US-amerikanischen Universitäten,
b) an deutschen Universitäten
erschienen sind, als Säulendiagramm darzustellen.  Zusätzlich sind in das Diagramm die vom Computer berechneten Trendlinien einzufügen und so zu verlängern, daß die für 1998 und 1999 zu erwartenden Häufigkeitsverläufe erkennbar werden.

                                                                                                     Zur Seitengliederung


Zusammenfassen relevanter Datenbanken zu einem Cluster


 
Die Analysen finden in einem Datenbankcluster statt. Das ist ein Komplex von Datenbanken, welcher die bezüglich des Analysethemas am meisten repräsentativen Datenbanken zu einer virtuellen Superdatenbank zusammenfaßt.  Für die Analyse steht damit eine bedeutend größere Menge an Nachweisen zur Verfügung, als es beim getrennten Betrachten jeder einzelnen Datenbank der Fall wäre. 
Dementsprechend größer ist auch die Menge der zum Analysethema aufgefundenen Nachweise. Dopplungen von Nachweisen, die dann auftreten, wenn eine Publikation in mehr als einer Datenbank verzeichnet ist, werden mittels einer Programmroutine aus der Fundmenge entfernt.

Mit dieser Methode läßt sich ein wesentlich genaueres Bild der in der Realität zum Analysethema existierenden Häufigkeitsverteilungen gewinnen, als es bei der Analyse einer einzelnen Datenbank möglich ist.

 
In den nachfolgenden Tabellen und in der Abbildung 1  werden die quantitativen Unterschiede zwischen dem getrennten Analysieren einer Reihe von einzelnen Datenbanken und der Analyse eines  Datenbankclusters, in welchem die einzelnen Datenbanken  zu einem Ganzen zusammengefaßt sind, anhand eines Beispiels veranschaulicht. 
Thema der Analysen ist die  Forschungsrichtung "Dünne organische Schichten" aus dem Bereich der Festkörperphysik. Die Daten stammen vom Mai 1995.
 
Vergleich von Häufigkeitsanalysen in Einzeldatenbanken und im Datenbankcluster


Thema der Analyse
Dünne organische Schichten
Jahr der Durchführung
1995
Ins Cluster einbezogene STN-Datenbanken
CA  (Chemical Abstracts)
BIOSIS
MEDLINE
COMPENDEX
EMBASE
INSPEC
JICST-EPLUS
Umfang der                                    Einzeldatenbanken
Zwischen 2,4 Mio. Nachweisen (JICST-EPLUS) und 12,3 Mio. Nachweisen (CA).
Umfang des Datenbankclusters
48,3 Mio. Nachweise
Fundstellen in den Einzeldatenbanken
Zwischen 100 Nachweisen (EMBASE) und 1.300 Nachweisen (INSPEC).
Fundstellen im Datenbankcluster
3.000 Nachweise
 
Vergleiche der Nachweismengen von 1995  mit den Jahren  1998 und 2002


Datenbanken 
1995
1998
2002
JICST-EPLUS
2,4 Mio.
3,7 Mio.
4,6 Mio.
CA
12,3 Mio.
14,7 Mio.
22,3 Mio.
Datenbankcluster
48,3 Mio.
57,8 Mio.
75,7 Mio.

 

Grafische Darstellung des Unterschiedes zwischen Häufigkeitsanalysen in Einzeldatenbanken
und im Datenbank-Cluster anhand eines Beispieles


Abbildung 1   Flächendiagramm der Publikationshäufigkeiten   zum Thema "Dünne 
  organische Schichten" im Zeitraum 1985-1994

Anmerkung: Das im Diagramm dargestellte Cluster umfaßt alle sieben der oben genannten Datenbanken. Duplikate von Publikationsnachweisen (Nachweise, die in mehr als einer Datenbank auftreten), wurden aus dem Cluster entfernt  In der grafischen Gegenüberstellung Einzeldatenbanken / Cluster  sind  aus Gründen der Anschaulichkeit nur  die Häufigkeitsverläufe der Datenbanken CA, JICST-EPLUS und INSPEC enthalten.
 
 
 
 
 
 
 
 
 
 
 
 
Zur Seitengliederung



Formen des Darstellens von Analyse-Ergebnissen


Die Ergebnisse der Analysen des Datenbankclusters werden als Text, Liste, Tabelle und Grafik aufbereitet und in kombinierter Form dem Auftraggeber zur Verfügung gestellt.
 
Beispiel einer Ergebnisdarstellung in Textform


Rangfolge der Autorenländer bei Publikationen zum Thema "Dünne organische Schichten" im Zeitraum 1985-1994
 
"Die gemeinschaftliche Analyse der repräsentativsten Online-Datenbanken zum Thema "Dünne organische Schichten" weist für den Zeitraum 1985/1994 eine Führungsposition der USA aus, welche die Publikationshäufigkeiten anderer Technologieländer um ein Mehrfaches überragt. Die Reihenfolge der nächsten sechs Länder ist: Japan, China, Deutschland, Frankreich, Großbritannien, UdSSR/Rußland.
Bemerkenswert ist der mit Beginn der neunziger Jahre einsetzende steile Anstieg der Zahl von Publikationen chinesischer Autoren. [....]."
Anmerkung:
"Autorenland" ( auch "Land des Autors" ) - dasjenige Land, in dem sich die Arbeitsstelle des Autors befindet. Die entsprechende Angabe kann in der Regel dem Datenfeld "Corporate Source" (bei der Datenbank CA: "Country of Author") des Publikationsnachweises entnommen werden..
 
Beispiel einer Ergebnisdarstellung in Form einer Liste


  Rangfolge chinesischer Forschungseinrichtungen bei Publikationen zum Thema "Dünne Schichten"  im Zeitraum 1985-1994
  Forschungeinrichtung Zahl der Publikationen
  Akademie der Wissenschaften, Institut für Physik, Peking
96
  Universität Peking, Institut für Physik
58
  Tsinghua-Universität Peking, Institut für Materialwissenschaft
17
  Nanking-Universität, Institut für Physik
16
  ............
......#
  ....... 
# ...
Anmerkung:
Die in der Liste ausgewiesenen, relativ hohen Publikationszahlen beziehen sich auf das Thema "Dünne Schichten". Sie enthalten dementsprechend außer den Zahlen zu "Dünne organische Schichten" auch die Publikationszahlen zu "Dünne nichtorganische Schichten".
 
Beispiel einer Ergebnisdarstellung in Form einer Tabelle


Publikationshäufigkeiten zum Thema "Dünne organische Schichten"
im Zeitraum 1989-1994
Jahr
USA
Japan
China
Deutschland Frankreich Großbritann.
1989
50
13
2
7
7
6
1990
46
24
7
10
4
5
1991
56
19
18
3
10
6
1992
89
31
25
9
10
4
1993
49
26
22
11
7
6
1994
67
26
30
20
8
10
Summe
357
139
104
60
46
37

 
Hinweis:
Mit Ausnahme der Ergebnisform "Liste" wurden in den aufgeführten Beispielen nur diejenigen Veröffentlichungen berücksichtigt, bei denen "Dünne organische Schichten" das Hauptthema ist. 
 
Beispiel einer Ergebnisdarstellung in Form einer Grafik  (siehe auch Abbildung 1)
Abbildung 2
 Publikationshäufigkeiten der sechs führenden Länder zum Thema "Dünne organische Schichten"  im Zeitraum 1989-1994
Zurück zum Abschnitt 4                                                                                                    Zur Seitengliederung des laufenden Abschnitts 2
Zum Abschnitt 3
Zur Hauptgliederung