Unscharfe Begriffe

Inhaltsübersicht

Grundbegriffe: Entität, Merkmal, Kategorie

Es geht in der Geschlechterdebatte bei Begriffen wie "Geschlecht", "Gender" etc. im Prinzip darum, real existierende Personen zu beschreiben. Zur Beschreibung der Realität gibt es diverse Ansätze, wir lehnen uns hier an zwei Begriffswelten an, und zwar grundlegenden Begriffen aus der Stochastik und fuzzy sets aus der Elektrotechnik.

Entitäten und Merkmale

Eine Entität ist irgend eine (real existierende) Einheit, die wir beschreiben wollen. Entitäten können Merkmale haben.

Eine Merkmal (Synonyme: Eigenschaft, Attribut, Kenngröße, Variable) hat für jede Entität, die dieses Merkmal aufweist, eine konkrete Ausprägung, die bei dieser Entität auftritt. Mathematiker definieren eine Eigenschaft als eine Funktion von der Menge der betrachteten Entitäten in die Menge möglicher Ausprägungen, die wir als Wertebereich oder Skala des Merkmals bezeichnen. Beispiele:

  1. Wir betrachten als Menge der Entitäten die Menge aller Personen. Als Merkmale betrachten wir die Körpergröße und die Haarfarbe. Die Körpergröße geben wir als ganze Zahl mit der Maßeinheit cm an, die Haarfarbe mit den üblichen verbalen Bezeichnungen wie blond, braun, schwarz usw.
  2. Wir betrachten als Menge der Entitäten mehrere Personengruppen, und zwar die Einwohner der Bundesländer. Als Merkmale dieser Personengruppen betrachten wir das Durchschnittsalter mit der Maßeinheit Jahr, den Anteil der homophilen (also männerliebenden) Personen (in %) und die Körpergröße der größten Person in der Gruppe (in cm).
Die beiden Beispiele sollen zeigen, daß man sehr genau unterscheiden muß, ob man einzelne Personen oder Gruppen von Personen und deren jeweiligen Merkmale betrachtet.

Typen von Merkmalen bzw. Wertebereichen

Man unterscheidet folgende Typen von Merkmalen anhand von deren Wertebereich:
  • diskrete Merkmale: Der Wertebereich ist endlich oder abzählbar.
  • stetige Merkmale: Der Wertebereich ist nicht abzählbar, z.B. die reellen Zahlen oder das reelle Intervall [0,250].
Wenn wir z.B. das Merkmal Körperlänge beliebig genau messen, würden wir das reelle Intervall [0,250] verwenden. Sofern man diese Zahlen auf ganze Zahlen rundet, zerlegt man den reellen Wertebereich in Abschnitte von 1.0 Länge und geht von einem stetigen Merkmal zu einem diskreten Merkmal über.

Weiterhin unterscheidet man mehrere Strukturen in den Wertebereiche:

  • Ein Wertebereich ist nominalskaliert, wenn die Menge der Werte nicht geordnet ist. Üblicherweise werden die Werte dann mit Namen bezeichnet, z.B. "schwarz", "grau" usw. beim Merkmal Haarfarbe. Mathematisch gesehen handelt es sich hier um eine einfache, unsortierte Menge.
  • Ein Wertebereich ist ordinalskaliert, wenn die Menge der Werte geordnet ist, aber keine sinnvolle Differenz gebildet werden kann. Beispiel: Rangstufen beim Militär oder in einem Unternehmen.
  • Ein Wertebereich ist intervallskaliert, wenn die Menge der Werte geordnet ist, die Differenz von zwei Werten gebildet werden kann und als solche sinnvoll interpretiert werden kann.

Binäre Wertebereiche

Merkmale von Personen haben häufig nur zwei Ausprägungen, die man als "vorhanden" bzw. "nicht vorhanden" bezeichnen kann. Beispiele sind das Wahlrecht, viele andere Rechte, Vorhandensein von bestimmten Organen, Kindern usw. In solchen Fällen sagt man oft, "das Merkmal X ist [nicht] vorhanden". Die ist als abgekürzte Ausdrucksweise für "das Merkmal X hat die Ausprägung '[nicht] vorhanden'" zu verstehen. Ein Merkmal X im Sinne einer Eigenschaft ist immer vorhanden, auch wenn die Ausprägung von X den Wert "nicht vorhanden" hat.

Klassifizierung bzw. Kategorisierung von Entitäten

Ein diskretes Merkmal kann dazu benutzt werden, die Entitätsmenge in Gruppen zu zerlegen. Jede Merkmalsausprägung definiert eine Klasse bzw. Kategorie, und zwar die Teilmenge der Entitäten, bei denen diese Merkmalsausprägung auftritt.

Beispiel: Vergröbert man z.B. die Körperlänge auf die Einheit dm (10 cm), dann bilden z.B. alle Personen, deren Körperlänge über 150 und bis einschließlich 160 cm beträgt, eine Kategorie. In ähnlicher Weise werden bei vielen Sportarten Gewichtskategorien gebildet.

Warnung: die Bezeichnung "Kategorie" wird nicht nur für Klassen, sondern auch für Merkmale (bzw. Eigenschaften oder Attribute) verwendet, z.B. in Ausdrücken wie "die Kategorie Gender ist ...". Dies ist oft sehr verwirrend.

Wir benötigen ferner ein Verfahren, um bei realen Entitäten festzustellen, welche Ausprägungen deren Merkmale haben. Wir nennen dies ein "Meßverfahren". Auch wenn dies technisch klingt, soll damit nicht ausgeschlossen sein, daß ggf. Menschen diese Messungen durchführen.

Merkmalsausprägungen als "Begriffe"

Der Begriff "Begriff" ist tückisch. Das zeigt schon der vorige Satz, in dem sich der Begriff "Begriff" scheinbar selber definiert (in Wirklichkeit kommt die Bezeichnung "Begriff" mit zwei verschiedenen Bedeutungsebenen vor). Als Begriffe werden regelmäßig folgende Dinge bezeichnet:
  1. Merkmale, z.B. "Geschlecht", "Farbe", "Körpergröße", ...
  2. Ausprägungen von Merkmale, z.B. "männlich", "blau-grau", "sehr groß", ...
  3. die Gruppe der Entitäten, die eine bestimmte Eigenschaft ausweist, z.B. "Männer", "Grauhaarige", "Riesen", ...
In Fragen wie "Was verstehen Sie unter Geschlecht / männlich / Männlichkeiten" wird oft nach solchen Begriffsdefinitionen gefragt.

Kategorien von Begriffen

Der Begriff Kategorie wird oft auch zur Gruppierung ähnlicher Begriffe verwendet, also als Metabegriff. Ein abstraktes Merkmal ist dann auf einmal eine Kategorie. Dies ist immer irritierend.


Unscharfe Begriffe und linguistische Terme

Im Alltag benutzt man sehr häufig Begriffe bzw. Kategorisierungen, bei denen die Zuordnung einer Entität zu einer der Kategorien nicht klar ist bzw. mehrere Kategorien infrage kommen. Als Beispiel betrachten wir die Temperatur eines Raums. Diese können wir objektiv messen, z.B. mit der Maßeinheit Grad und dem reellwertigen Intervall [0,35] als Wertebereich. Wir beschreiben die Temperatur verbal mit Begriffen wie "kalt", "warm" oder "heiß". Man kann jetzt versuchen, diese Begriffe auf passende Mengen konkreter Temperaturen abzubilden, z.B. von 0 - 15 Grad ist es "kalt", von 16 - 28 Grad "warm" und darüber "heiß". Dies entspricht aber nicht der üblichen Denkweise: 16 Grad sind nicht wirklich warm, sondern auch noch ein bißchen kalt. D.h. Begriffe wie "kalt" und "warm" sind unscharf und können mehr oder weniger zutreffend sein.

Die sog. Fuzzylogik bietet eine präzise Fassung für derartige alltäglichen Denkmuster. Unscharfe Begriffe wie "kalt" und "warm" werden hier als linguistische Terme bezeichnet. Vorausgesetzt wird ein "exakt" meßbares Bezugsmerkmal, z.B. die Raumtemperatur. Der Grad des Zutreffens eines unscharfen Begriffs wird nun als Funktion vom Wertebereich des Bezugsmerkmals in das reelle Intervall [0,1] dargestellt. 0 bedeutet, daß der unscharfe Begriff gar nicht zutrifft, 1 bedeutet, daß der unscharfe Begriff völlig zutrifft. Das folgende Bild zeigt ein Beispiel für die drei oben benutzten linguistischen Terme für die Raumtemperatur:

C WP

"kalt" kann z.B. von 0 - 14 Grad zu 100% zutreffen, über 18 Grad zu 0%, dazwischen fällt der Grad des Zutreffens linear ab (s. blaue Linie im Bild). Warm kann unter 14 Grad zu 0%, von 18 - 26 Grad zu 100% und ab 30 Grad wieder zu 0% zutreffen, zwischen 14 und 18 und zwischen 26 und 30 entsprechend dem Bild interpoliert.

Bei 15 Grad würde "kalt" zu 75%, also ziemlich, zutreffen und gleichzeitig "warm" zu 25%, also ein bißchen. Dieses Beispiel zeigt, daß einem exakten Wert des Bezugsmerkmals (15 Grad) i.a. mehrere zutreffende linguistische Terme zugeordnet werden.

Unscharfe Mengen (Fuzzy Sets)

Die Zugehörigkeitsfunktion eines linguistischen Terms definiert folgende Teilmenge des Wertebereichs des Bezugsmerkmals: alle Werte mit Zugehörigkeit ungleich Null. Diese (Teil-) Menge wird auch als unscharfe Menge (fuzzy set) bezeichnet.

Kategorisierung von Entitäten anhand linguistischer Terme

Eine erste sehr einfache Kategorisierung besteht darin, jedem linguistischen Term als Kategorie die Menge der Entitäten zuzuordnen, bei denen der Grad des Zutreffens dieses Terms größer 0 ist. Allerdings könnten diese Kategorien überlappen. Wenn disjunkte Kategorien erforderlich sind, kann man eine Entität derjenigen Kategorie zuordnen, deren linguistischer Term den größten Grad des Zutreffens hat. Hier muß vermieden werden (vor allem bei diskreten Bezugsmerkmalen), daß zwei linguistische Terme in exakt gleichem Maße zutreffen.

Fuzzylogik

Die Fuzzylogik bietet aufbauend auf diesen grundlegenden Konzepten Operationen mit fuzzy sets an, die als eine Verallgemeinerung der klassischen zweiwertigen Logik angesehen werden kann und die u.a. logische Operatoren wie UND, ODER, NICHT u.a. definiert (mehr Details).

Vergleich von linguistischen Termen mit Werten in nominalskalierten Wertebereichen

Die linguistischen Terme, die hier gebildet wurden, wirken auf den ersten Blick wie nominalskalierte Werte eines Wertebereichs, der durch Vergröberung der Meßgenauigkeit entstanden sind. Dies trifft aber nicht zu:
  • Nominalskalierte Werte treffen auf eine Entität immer nur ganz oder gar nicht zu, man kann damit keine Grade des Zutreffens ("ziemlich kalt") ausdrücken.
  • Für jede Entität trifft genau einer der nominalskalierten Werte zu. Die abgeleitete Kategorisierung ist automatisch eine disjunkte Zerlegung des Wertebereich des Bezugsmerkmals. Beides trifft auf linguistische Terme nicht zu.
  • Die Menge der linguistischen Terme, die man zu einem Wertebereich bildet, ist beliebig, jeder linguistische Term existiert unabhängig von den anderen, man kann bei Bedarf neue hinzunehmen oder alte "vergessen". Dies trifft auf nominalskalierte Wertebereiche nicht zu.
  • Linguistische Terme sind im Prinzip nicht geordnet, auch wenn der Wertebereich des Bezugsmerkmals geordnet ist. Wenn wir z.B. den Term "ekelhaft" für Temperaturen unter 4 Grad oder über 33 Grad hinzunehmen, dann kann man diese Angabe nicht sinnvoll als größer oder als kleiner als "kalt" ansehen.