Inhaltsübersicht
Grundbegriffe: Entität, Merkmal, Kategorie
Es geht in der Geschlechterdebatte bei Begriffen wie
"Geschlecht", "Gender" etc. im Prinzip darum, real existierende
Personen zu beschreiben. Zur Beschreibung der Realität gibt es
diverse Ansätze, wir lehnen uns hier an zwei Begriffswelten an,
und zwar grundlegenden Begriffen aus der Stochastik und fuzzy
sets aus der Elektrotechnik.
Entitäten und Merkmale
Eine Entität ist irgend eine (real existierende) Einheit, die wir beschreiben wollen. Entitäten können Merkmale haben. Eine Merkmal (Synonyme: Eigenschaft, Attribut, Kenngröße, Variable) hat für jede Entität, die dieses Merkmal aufweist, eine konkrete Ausprägung, die bei dieser Entität auftritt. Mathematiker definieren eine Eigenschaft als eine Funktion von der Menge der betrachteten Entitäten in die Menge möglicher Ausprägungen, die wir als Wertebereich oder Skala des Merkmals bezeichnen. Beispiele:- Wir betrachten als Menge der Entitäten die Menge aller Personen. Als Merkmale betrachten wir die Körpergröße und die Haarfarbe. Die Körpergröße geben wir als ganze Zahl mit der Maßeinheit cm an, die Haarfarbe mit den üblichen verbalen Bezeichnungen wie blond, braun, schwarz usw.
- Wir betrachten als Menge der Entitäten mehrere Personengruppen, und zwar die Einwohner der Bundesländer. Als Merkmale dieser Personengruppen betrachten wir das Durchschnittsalter mit der Maßeinheit Jahr, den Anteil der homophilen (also männerliebenden) Personen (in %) und die Körpergröße der größten Person in der Gruppe (in cm).
Typen von Merkmalen bzw. Wertebereichen
Man unterscheidet folgende Typen von Merkmalen anhand von deren Wertebereich:- diskrete Merkmale: Der Wertebereich ist endlich oder abzählbar.
- stetige Merkmale: Der Wertebereich ist nicht abzählbar, z.B. die reellen Zahlen oder das reelle Intervall [0,250].
- Ein Wertebereich ist nominalskaliert, wenn die Menge der Werte nicht geordnet ist. Üblicherweise werden die Werte dann mit Namen bezeichnet, z.B. "schwarz", "grau" usw. beim Merkmal Haarfarbe. Mathematisch gesehen handelt es sich hier um eine einfache, unsortierte Menge.
- Ein Wertebereich ist ordinalskaliert, wenn die Menge der Werte geordnet ist, aber keine sinnvolle Differenz gebildet werden kann. Beispiel: Rangstufen beim Militär oder in einem Unternehmen.
- Ein Wertebereich ist intervallskaliert, wenn die Menge der Werte geordnet ist, die Differenz von zwei Werten gebildet werden kann und als solche sinnvoll interpretiert werden kann.
Binäre Wertebereiche
Merkmale von Personen haben häufig nur zwei Ausprägungen, die man als "vorhanden" bzw. "nicht vorhanden" bezeichnen kann. Beispiele sind das Wahlrecht, viele andere Rechte, Vorhandensein von bestimmten Organen, Kindern usw. In solchen Fällen sagt man oft, "das Merkmal X ist [nicht] vorhanden". Die ist als abgekürzte Ausdrucksweise für "das Merkmal X hat die Ausprägung '[nicht] vorhanden'" zu verstehen. Ein Merkmal X im Sinne einer Eigenschaft ist immer vorhanden, auch wenn die Ausprägung von X den Wert "nicht vorhanden" hat.Klassifizierung bzw. Kategorisierung von Entitäten
Ein diskretes Merkmal kann dazu benutzt werden, die Entitätsmenge in Gruppen zu zerlegen. Jede Merkmalsausprägung definiert eine Klasse bzw. Kategorie, und zwar die Teilmenge der Entitäten, bei denen diese Merkmalsausprägung auftritt. Beispiel: Vergröbert man z.B. die Körperlänge auf die Einheit dm (10 cm), dann bilden z.B. alle Personen, deren Körperlänge über 150 und bis einschließlich 160 cm beträgt, eine Kategorie. In ähnlicher Weise werden bei vielen Sportarten Gewichtskategorien gebildet.Warnung: die Bezeichnung "Kategorie" wird nicht nur für Klassen, sondern auch für Merkmale (bzw. Eigenschaften oder Attribute) verwendet, z.B. in Ausdrücken wie "die Kategorie Gender ist ...". Dies ist oft sehr verwirrend.Wir benötigen ferner ein Verfahren, um bei realen Entitäten festzustellen, welche Ausprägungen deren Merkmale haben. Wir nennen dies ein "Meßverfahren". Auch wenn dies technisch klingt, soll damit nicht ausgeschlossen sein, daß ggf. Menschen diese Messungen durchführen.
Merkmalsausprägungen als "Begriffe"
Der Begriff "Begriff" ist tückisch. Das zeigt schon der vorige Satz, in dem sich der Begriff "Begriff" scheinbar selber definiert (in Wirklichkeit kommt die Bezeichnung "Begriff" mit zwei verschiedenen Bedeutungsebenen vor). Als Begriffe werden regelmäßig folgende Dinge bezeichnet:- Merkmale, z.B. "Geschlecht", "Farbe", "Körpergröße", ...
- Ausprägungen von Merkmale, z.B. "männlich", "blau-grau", "sehr groß", ...
- die Gruppe der Entitäten, die eine bestimmte Eigenschaft ausweist, z.B. "Männer", "Grauhaarige", "Riesen", ...
Kategorien von Begriffen
Der Begriff Kategorie wird oft auch zur Gruppierung ähnlicher Begriffe verwendet, also als Metabegriff. Ein abstraktes Merkmal ist dann auf einmal eine Kategorie. Dies ist immer irritierend.Unscharfe Begriffe und linguistische Terme
Im Alltag benutzt man sehr häufig Begriffe bzw.
Kategorisierungen, bei denen die Zuordnung einer Entität
zu einer der Kategorien nicht klar ist bzw. mehrere
Kategorien infrage kommen. Als Beispiel betrachten wir die
Temperatur eines Raums. Diese können wir objektiv messen,
z.B. mit der Maßeinheit Grad und dem reellwertigen
Intervall [0,35] als Wertebereich. Wir beschreiben die
Temperatur verbal mit Begriffen wie "kalt", "warm" oder
"heiß". Man kann jetzt versuchen, diese Begriffe auf
passende Mengen konkreter Temperaturen abzubilden, z.B.
von 0 - 15 Grad ist es "kalt", von 16 - 28 Grad "warm" und
darüber "heiß". Dies entspricht aber nicht der üblichen
Denkweise: 16 Grad sind nicht wirklich warm, sondern auch
noch ein bißchen kalt. D.h. Begriffe wie "kalt" und "warm"
sind unscharf und können mehr oder weniger zutreffend
sein.
Die sog. Fuzzylogik
bietet eine präzise Fassung für derartige alltäglichen
Denkmuster. Unscharfe Begriffe wie "kalt" und "warm"
werden hier als linguistische Terme bezeichnet.
Vorausgesetzt wird ein "exakt" meßbares Bezugsmerkmal,
z.B. die Raumtemperatur. Der Grad des Zutreffens
eines unscharfen Begriffs wird nun als Funktion vom
Wertebereich des Bezugsmerkmals in das reelle Intervall
[0,1] dargestellt. 0 bedeutet, daß der unscharfe Begriff
gar nicht zutrifft, 1 bedeutet, daß der unscharfe Begriff
völlig zutrifft. Das folgende Bild zeigt ein Beispiel für
die drei oben benutzten linguistischen Terme für die
Raumtemperatur:
"kalt" kann z.B. von 0 - 14 Grad zu 100%
zutreffen, über 18 Grad zu 0%, dazwischen fällt der Grad
des Zutreffens linear ab (s. blaue Linie im Bild). Warm
kann unter 14 Grad zu 0%, von 18 - 26 Grad zu 100% und ab
30 Grad wieder zu 0% zutreffen, zwischen 14 und 18 und
zwischen 26 und 30 entsprechend dem Bild interpoliert.
Bei 15 Grad würde "kalt" zu 75%, also ziemlich, zutreffen
und gleichzeitig "warm" zu 25%, also ein bißchen. Dieses
Beispiel zeigt, daß einem exakten Wert des
Bezugsmerkmals (15 Grad) i.a. mehrere zutreffende
linguistische Terme zugeordnet werden.
Unscharfe Mengen (Fuzzy Sets)
Die Zugehörigkeitsfunktion eines linguistischen Terms definiert folgende Teilmenge des Wertebereichs des Bezugsmerkmals: alle Werte mit Zugehörigkeit ungleich Null. Diese (Teil-) Menge wird auch als unscharfe Menge (fuzzy set) bezeichnet.Kategorisierung von Entitäten anhand linguistischer Terme
Eine erste sehr einfache Kategorisierung besteht darin, jedem linguistischen Term als Kategorie die Menge der Entitäten zuzuordnen, bei denen der Grad des Zutreffens dieses Terms größer 0 ist. Allerdings könnten diese Kategorien überlappen. Wenn disjunkte Kategorien erforderlich sind, kann man eine Entität derjenigen Kategorie zuordnen, deren linguistischer Term den größten Grad des Zutreffens hat. Hier muß vermieden werden (vor allem bei diskreten Bezugsmerkmalen), daß zwei linguistische Terme in exakt gleichem Maße zutreffen.Fuzzylogik
Die Fuzzylogik bietet aufbauend auf diesen grundlegenden Konzepten Operationen mit fuzzy sets an, die als eine Verallgemeinerung der klassischen zweiwertigen Logik angesehen werden kann und die u.a. logische Operatoren wie UND, ODER, NICHT u.a. definiert (mehr Details).Vergleich von linguistischen Termen mit Werten in nominalskalierten Wertebereichen
Die linguistischen Terme, die hier gebildet wurden, wirken auf den ersten Blick wie nominalskalierte Werte eines Wertebereichs, der durch Vergröberung der Meßgenauigkeit entstanden sind. Dies trifft aber nicht zu:- Nominalskalierte Werte treffen auf eine Entität immer nur ganz oder gar nicht zu, man kann damit keine Grade des Zutreffens ("ziemlich kalt") ausdrücken.
- Für jede Entität trifft genau einer der nominalskalierten Werte zu. Die abgeleitete Kategorisierung ist automatisch eine disjunkte Zerlegung des Wertebereich des Bezugsmerkmals. Beides trifft auf linguistische Terme nicht zu.
- Die Menge der linguistischen Terme, die man zu einem Wertebereich bildet, ist beliebig, jeder linguistische Term existiert unabhängig von den anderen, man kann bei Bedarf neue hinzunehmen oder alte "vergessen". Dies trifft auf nominalskalierte Wertebereiche nicht zu.
- Linguistische Terme sind im Prinzip nicht geordnet, auch wenn der Wertebereich des Bezugsmerkmals geordnet ist. Wenn wir z.B. den Term "ekelhaft" für Temperaturen unter 4 Grad oder über 33 Grad hinzunehmen, dann kann man diese Angabe nicht sinnvoll als größer oder als kleiner als "kalt" ansehen.