Fächer

Betriebswirtschaftslehre
Biologie
Chemie
Deutsch
Englisch
Erdkunde
Erziehungswissenschaften
Ethik
Französisch
Geschichte
Informatik
- Biografien
- Facharbeiten
- Referate
Italienisch
Kunst
Latein
Mathematik
Musik
Philosophie
Physik
Politik
Psychologie
Rechtswissenschaften
Religion
Sozialwissenschaften
Spanisch
Sport

Hayes Befehle

Die wichtigsten Hayes Befehle AT Wenn Sie nur AT eingeben, paÃŸt sich das Modem automatisch auf die von Ihrem Teminalprogramm vorgegebene Geschwindigkeit an. Beachten Sie das sich ein 2400 -...

522 Worte in "deutsch" als "hilfreich" bewertet
Datenkompremierung

1) Datenkompremierung (File Compression): Dieser Algorithmus behandelt in erster Linie die Platzreduzierung und erst in zweiter Linie behandelt er die Zeitreduzierung. Diese Technik heiÃŸt...

1210 Worte in "deutsch" als "hilfreich" bewertet
EinfÃ¼hrung JavaScript

JavaScript JavaScript ist eine Skriptsprache mit der man Client - und Server - Internetprogramme entwickeln kann. In einem Web - Browser wie Netscape oder Internet Explorer kann man die in...

2807 Worte in "deutsch" als "hilfreich" bewertet

Gestreute Speicherung

Hashing - Gestreute Speicherung

1. EinfÃ¼hrung

Vom Hashing spricht man, wenn Daten in einem Speicherbereich mit direktem Zugriff (der Hash - Tabelle) gespeichert werden und auf jedes gespeicherte Datenelement direkt zugegriffen wird.
Dieser direkte Zugriff ist nur Ã¼ber einen Index mÃ¶glich. Doch man verwaltet die Indizes nicht, wie Ã¼blich, in einer eigenen Tabelle, sondern errechnet den Index eines Datensatzes direkt aus seinem SchlÃ¼ssel.

ZurÃ¼ck zum Inhaltsverzeichnis

2. Die Hash - Tabelle

Die Hash - Tabelle ist jener Speicherbereich, Ã¼ber den die DatensÃ¤tze verteilt werden sollen. Dabei stellt sich die Frage, wie groÃŸ die Tabelle denn sein soll.

Ist sie zu klein, so ist sie zu hoch ausgelastet und es kommt zu vielen Kollisionen (Begriff Kollision: siehe weiter unten). Ist sie zu groÃŸ, so wird Speicherplatz verschwendet. In diesem Zusammenhang ist der Begriff des Belegungsfaktors zu erwÃ¤hnen:
Belegungsfaktor = Anzahl der DatensÃ¤tze / Anzahl der SpeicherplÃ¤tze
Der Belegungsfaktor sollte zwischen 0,5 und 0,8 liegen.

ZurÃ¼ck zum Inhaltsverzeichnis

3. Die Hash - Funktion

Die Hash - Funktion ist eine mathematische Funktion, die aus dem SchlÃ¼ssel eines Datensatzes einen Index fÃ¼r die Hash - Tabelle errechnet.
Diese Funktion soll so gewÃ¤hlt werden, dass

die Daten so abgebildet werden, dass der Grenzwertindex nicht Ã¼berschritten wird, die Daten mÃ¶glichst gleich Ã¼ber die Hash - Tabelle verteilt sind und es zu mÃ¶glichst wenigen Kollisionen kommt.
ZurÃ¼ck zum Inhaltsverzeichnis

3. 1. Geeignete Hash - Funktionen fÃ¼r Zahlen

Wenn der SchlÃ¼ssel eines Datensatzes eine Zahl ist, so wird als Hash - Funktion meist das Divisionsrestverfahren bzw. eine etwas modifizierte Variante davon angewendet:

H(K) = K mod M
H(K) ist die Hash - Funktion, K der SchlÃ¼sselwert und M die GrÃ¶ÃŸe des Arrays.

Um die Kollisionsbearbeitung (siehe weiter unten) zu erleichtern, sollte fÃ¼r M nach MÃ¶glichkeit eine Primzahl gewÃ¤hlt werden.

ZurÃ¼ck zum Inhaltsverzeichnis

3. 2. Geeignete Hash - Funktionen fÃ¼r Zeichenketten

Die naheliegendste LÃ¶sung fÃ¼r Zeichenketten ist wohl, die Quersumme Ã¼ber die ASCII - Codes der einzelnen Zeichen zu bilden und auf das Ergebnis das Divisionsrestverfahren anzuwenden.
Weiters kÃ¶nnte man die ganze Zeichenkette als Zahl interpretieren und auf diese Zahl wiederum das Divisionsrestverfahren anwenden. Der Nachteil dabei ist allerdings, dass dabei relativ hohe Zahlen entstehen (z. B.: KARLI = 0x4B41524C49).
Um das zu verhindern, sollte man nach jedem Buchstaben die Modulu - Operation anwenden:

A = 65, I = 73, K = 75, L = 76, R = 82
GrÃ¶ÃŸe der Hash - Tabelle = 499

K: 75 mod 499 = 75
A: (75 * 256 + 65) mod 499 = 303
R: (303 * 256 + 82) mod 499 = 305
L: (305 * 256 + 76) mod 499 = 312
I: (312 * 256 + 73) mod 499 = 105

Der Datensatz mit dem SchlÃ¼sselwert "KARLI" wird somit in der Hash - Tabelle am Speicherplatz 105 gespeichert.

Beispiel fÃ¼r Implementierung:
unsigned int hash (char *key, unsigned int m)
{
int h;
for (h = 0; *key != '\0'; key++) h = (256 * h + *key) % m;
return (h);
}
Hinweis: "key" ist der SchlÃ¼sselbegriff, "m" die GrÃ¶ÃŸe der Hash - Tabelle.

ZurÃ¼ck zum Inhaltsverzeichnis

4. Kollisionsverfahren

Beispiel:
SchlÃ¼sselwerte sind Ganzzahlen, die Hash - Tabelle umfaÃŸt 499 SpeicherplÃ¤tze.
Es soll das Divisionsrestverfahren angewendet werden.
Zu speichernde Werte: 3598, 6093.
3598 mod 499 = 105
6093 mod 499 = 105

Der Datensatz 3598 kann zwar am Speicherplatz 105 abgelegt werden, beim Speichern des Satzes 6093 ergibt sich allerdings das Problem, dass der errechnete Speicherplatz nicht mehr frei ist.
Es ist ein Kollisionsverfahren anzuwenden. Das ist eine Methode, um SchlÃ¼ssel mit gleichem Ergebnis der Hash - Funktion an anderen Stellen abzulegen und wieder zu finden.

ZurÃ¼ck zum Inhaltsverzeichnis

4. 1. Interne KollisionsauflÃ¶sung (Lineares Austesten)

FÃ¼r das Element wird ein Platz innerhalb der Tabelle gesucht, z. B. wird der nÃ¤chste bzw. Ã¼bernÃ¤chste Platz genommen. Der Nachteil dabei ist die Clusterbildung.
Die Tabelle enthÃ¤lt neben dem Datensatz selbst auch die Anzahl der DatensÃ¤tze, deren berechneter Hashcode dem tatsÃ¤chlichen Index an dieser Position entspricht (z. B. an Position 4 wird die Anzahl der SÃ¤tze gespeichert, fÃ¼r die als Hashcode 4 errechnet wurde).
Man benÃ¶tigt auÃŸerdem einen speziellen Wert, der anzeigt, daÃ¼ eine Position in der Hash - Tabelle "frei" ist, z. B. bei Strings einen Leerstring oder - 1 bei Zahlen (Voraussetzung ist natÃ¼rlich, dass diese Werte nicht als SchlÃ¼ssel auftreten kÃ¶nnen).
Der Vorteil gegenÃ¼ber dem externen Verfahren ist die schnelle Positionierung. Allerdings wird die KapazitÃ¤t der Hash - Tabelle bei geringer Auslastung schlecht genutzt.
Durch oftmaliges LÃ¶schen und EinfÃ¼gen von DatensÃ¤tzen kann sich beim internen Verfahren die Anzahl der Zugriffe stark erhÃ¶hen.

Beispiel:
SchlÃ¼sselwerte sind Zeichenketten.
H("Carmen") = 2, H("Renate") = 6, H("Tina") = 4, H("Veronika") = 2
Kollisionsverfahren: Neuer Hashcode = Alter Hashcode + 3
Wenn PlÃ¤tze nicht belegt sind, werden die Personen - ID und der berechnete Index auf - 1 gesetzt.

tatsÃ¤chlicher Index	berechneter Index	Datensatz - ID	Anz. Elemente mit diesem Hashcode
1	- 1		0
2	2	Carmen	2
3	- 1		0
4	4	Tina	1
5	2	Veronika	0
6	6	Renate	1

Suche nach Datensatz "Veronika":

Hashcode errechnen (im Beispiel: 2) Vergleiche SuchschlÃ¼ssel mit gespeicherter Datensatz - ID auf Position 2 und stelle fest, daÃ¼ "Veronika" <> "Carmen" Gehe 3 Positionen weiter Erneuter Vergleich mit Datensatz - ID auf Position 5, Suche erfolgreich Beim LÃ¶schen des Datensatzes "Veronika" ist zu berÃ¼cksichtigen, dass die Anzahl der Elemente mit Hashcode 2 (nicht 5) um 1 vermindert werden muss (im Beispiel: Anzahl bei "Carmen" auf 1 setzen).

Die durchschnittliche Anzahl der Zugriffe beim Suchen nach einem Datensatz, der tatsÃ¤chlich in der Tabelle existiert, berechnet sich nach folgender Formel:
0,5 + 1 / (2 * (1 - Auslastung))

Beim erfolglosen Suchen:
0,5 + 1 / (2 * (1 - Auslastung) hoch 2)

Beispiele:

Auslastung	50 %	70 %	80 %
durchschn. Zugriffe bei erfolgloser Suche	2,5	6,1	13,0
durchschn. Zugriffe bei erfolgreicher Suche	1,5	2,2	3,0

ZurÃ¼ck zum Inhaltsverzeichnis

4. 2. Externe KollisionsauflÃ¶sung

Anstelle der Daten enthÃ¤lt die Hash - Tabelle nur Zeiger auf die eigentlichen Daten. Bei einer Kollision wird eine verkettete Liste aufgebaut.
Vorteile gegenÃ¼ber dem internen Verfahren:

Es kÃ¶nnen auch mehr SÃ¤tze gespeichert werden, als eigentlich in der Hash - Tabelle Platz hÃ¤tten. Der Speicherbereich ist nicht fix, daher wird auch bei geringer Auslastung kein Speicherplatz verschwendet. Beim LÃ¶schen und EinfÃ¼gen werden einfache Listenoperationen getÃ¤tigt. Nachteile gegenÃ¼ber dem internen Verfahren:

Der Vorteil des Hashings, die direkte Positionierung, geht teilweise verloren (weil man bei Kollisionen die Liste sequentiell durchlesen muss). Bei hoher Auslastung entstehen lange Listen. Beispiel: Angabe wie oben

Index	Anzahl	Liste
1	0
2	2	Carmen, Veronika
3	0
4	1	Tina
5	0
6	1	Renate

ZurÃ¼ck zum Inhaltsverzeichnis

5. Doppeltes Hashing

Das doppelte Hashing verwendet die Methode der internen KollisionsauflÃ¶sung mit dem Ziel, Clusterbildung zu vermeiden. Das wird erreicht, indem nicht, so wie beim linearen Austesten, bei einer Kollision immer ein konstanter Betrag addiert wird, sondern ein vom SchlÃ¼ssel abhÃ¤ngiger Wert.

Beispiel:
H2(K) = 1 + (K / M) mod (M - 1)
K ist der SchlÃ¼sselwert, M die GrÃ¶ÃŸe der Hash - Tabelle.
Bei der Division (K / M) handelt es sich um eine Ganzzahldivision.

Beispiel:
Die Hash - Tabelle bietet Platz fÃ¼r 11 DatensÃ¤tze.
SchlÃ¼sselwerte sind Ganzzahlen ("Personen - ID").
Wenn PlÃ¤tze nicht belegt sind, werden die Personen - ID und der berechnete Index auf - 1 gesetzt.
1. Hash - Funktion: H(K) = K mod M
2. Hash - Funktion: H2(K) = 1 + (K / M) mod (M - 1)

tatsÃ¤chlicher Index	berechneter Index	Personen - ID	Name	Anz. Elemente mit diesem Hashcode
0	- 1	- 1		0
1	- 1	- 1		0
2	9	42	Stangl	0
3	3	25	Meier	1
4	4	37	Huber	1
5	- 1	- 1		0
6	- 1	- 1		0
7	- 1	- 1		0
8	- 1	- 1		0
9	9	20	Schmidt	2
10	10	54	Gruber	1

tatsÃ¤chlicher Index	berechneter Index	Personen - ID	Name	Anz. Elemente mit diesem Hashcode
0	0	11	BÃ¶ck	1
1	9	31	Wagner	0
2	9	42	Stangl	0
3	3	25	Meier	1
4	4	37	Huber	3
5	4	4	Steiner	0
6	4	15	Richter	0
7	- 1	- 1		0
8	- 1	- 1		0
9	9	20	Schmidt	3
10	10	54	Gruber	1

tatsÃ¤chlicher Index	berechneter Index	Personen - ID	Name	Anz. Elemente mit diesem Hashcode
0	0	11	BÃ¶ck	1
1	9	31	Wagner	0
2	- 1	- 1	Stangl	0
3	3	25	Meier	1
4	4	37	Huber	2
5	4	4	Steiner	1
6	- 1	- 1	Richter	0
7	5	16	Bauer	0
8	- 1	- 1		0
9	9	20	Schmidt	2
10	10	54	Gruber	1

Die durchschnittliche Anzahl der Zugriffe beim Suchen nach einem Datensatz, der tatsÃ¤chlich in der Tabelle existiert, berechnet sich bei diesem Verfahren nach folgender Formel:
- ln (1 - Auslastung) / Auslastung

Beim erfolglosen Suchen:
1 / (1 - Auslastung)

Beispiele:

Auslastung	50 %	70 %	80 %
durchschn. Zugriffe bei erfolgloser Suche	2,0	3,3	5,0
durchschn. Zugriffe bei erfolgreicher Suche	1,4	1,7	2,0

ZurÃ¼ck zum Inhaltsverzeichnis

1577 Worte in "deutsch" als "hilfreich" bewertet

Hayes Befehle

Datenkompremierung

EinfÃ¼hrung JavaScript

Gestreute Speicherung

Hashing - Gestreute Speicherung

1. EinfÃ¼hrung

2. Die Hash - Tabelle

3. Die Hash - Funktion

3. 1. Geeignete Hash - Funktionen fÃ¼r Zahlen

3. 2. Geeignete Hash - Funktionen fÃ¼r Zeichenketten

4. Kollisionsverfahren

4. 1. Interne KollisionsauflÃ¶sung (Lineares Austesten)

4. 2. Externe KollisionsauflÃ¶sung

5. Doppeltes Hashing