1
00:00:02,000 --> 00:00:06,160
Moin Leute zu Folge 95 von 
einfach komplex heute. 

2
00:00:06,560 --> 00:00:08,880
Wie sagt man taufrisch aus dem 
Podcast Ofen? 

3
00:00:09,200 --> 00:00:11,000
Wir sind tatsächlich ein 
bisschen spät dran, deswegen 

4
00:00:11,000 --> 00:00:14,240
gibt es die Folge später, aber 
dafür umso aktuelleres Thema. 

5
00:00:14,640 --> 00:00:17,760
Wir wollen nochmal über Machine 
Learning sprechen, maschinelles 

6
00:00:17,760 --> 00:00:22,480
Lernen auf Deutsch, was die 
Technologie hinter dem 

7
00:00:22,560 --> 00:00:25,120
eigentlich ist, was heute nur 
noch KI oder künstliche 

8
00:00:25,120 --> 00:00:28,240
Intelligenz genannt wird, dem 
ganzen Mal ein bisschen auf den 

9
00:00:28,240 --> 00:00:29,920
Grund gehen, was steckt 
dahinter? 

10
00:00:30,240 --> 00:00:33,120
Welche Arten von maschinellem 
Lernen gibt es eigentlich? 

11
00:00:33,280 --> 00:00:35,600
Und vielleicht auch die 
Geschichte angucken? 

12
00:00:35,600 --> 00:00:38,080
Noch mal ganz kurz, ja, es ist 
ja kein Geschichtspodcast, 

13
00:00:38,080 --> 00:00:40,880
sondern Technik Podcast. 
Und dann hat Burkhard natürlich 

14
00:00:40,880 --> 00:00:44,160
coole Beispiele dabei für diese 
Arten des maschinellen Lernens 

15
00:00:44,160 --> 00:00:46,360
passt das, soweit Burkhard und 
Moin erstmal. 

16
00:00:46,880 --> 00:00:49,120
Ja Moin Gerrit, ja ich denke 
schon, wir gucken mal. 

17
00:00:49,120 --> 00:00:51,360
Ich hab Gerrit heute schon 
gesagt, in der Vorbereitung frag

18
00:00:51,360 --> 00:00:54,560
mich einfach ich das Thema ist 
einfach so gigantisch und wir 

19
00:00:54,560 --> 00:00:56,240
wollen gar nicht so lange 
darüber reden. 

20
00:00:56,520 --> 00:00:58,600
Also es gibt natürlich Leute, 
die haben da zurecht viele 

21
00:00:58,600 --> 00:01:01,440
Bücher geschrieben. 
Die Mathematik geht bis zum 

22
00:01:01,440 --> 00:01:04,720
Sankt nimmerleins Tag und so 
weiter also für die Einordnung 

23
00:01:04,720 --> 00:01:06,680
wir wir, wir wollen mal gucken, 
dass wir das einfach so n 

24
00:01:06,680 --> 00:01:10,240
bisschen gliedern und so weiter 
so n bisschen heia Level ja und 

25
00:01:10,240 --> 00:01:12,560
es ist ne doppelurlaubsfolge 
muss man sagen Ja Gerrit ist 

26
00:01:12,560 --> 00:01:15,240
weder Gerrit noch ich sind in 
Hamburg oder irgendwo in der 

27
00:01:15,240 --> 00:01:18,760
Nähe von Hamburg mal gucken ja 
aber ich denke das passt ja wir 

28
00:01:18,760 --> 00:01:21,600
kriegen das hin, Leute. 
Gut, also ich bin bereit 

29
00:01:21,600 --> 00:01:24,480
geredet, es geht los, so aber. 
Wir wollen ja keine Sommerpause 

30
00:01:24,480 --> 00:01:26,200
machen oder so, oder? 
Oder Herbstpause ist in dem 

31
00:01:26,200 --> 00:01:28,560
Fall, deswegen ziehen wir es 
einfach durch und ja, 

32
00:01:28,560 --> 00:01:30,800
maschinelles Lernen, also ich 
hatte ja gesagt, die Einordnung 

33
00:01:30,800 --> 00:01:33,520
ist erste und ich hab geguckt 
und ich fand dieses Bild total 

34
00:01:33,520 --> 00:01:36,720
spannend, der matroschka, 
Puppen, die äußerste matroschka 

35
00:01:36,720 --> 00:01:40,560
Puppe die wir alle sehen ist KI 
Maschinen irgendwie intelligent 

36
00:01:40,560 --> 00:01:43,520
zu machen, mit Maschinen 
kommunizieren zu können wie es 

37
00:01:43,520 --> 00:01:46,480
mit Menschen der Fall ist und so
das ist das was wir gerade alle 

38
00:01:46,480 --> 00:01:49,600
sehen und irgendwie. 
Uns darunter vorstellen und da 

39
00:01:49,600 --> 00:01:52,480
drunter die Puppe, die also 
etwas kleiner ist, aber gar 

40
00:01:52,480 --> 00:01:54,960
nicht für uns sichtbar. 
Das ist eigentlich der Weg, wie 

41
00:01:54,960 --> 00:01:57,520
das funktioniert, und das kann 
man sich vorstellen als 

42
00:01:57,520 --> 00:02:00,440
maschinelles Lernen letzten 
Endes ne was dahinter steckt 

43
00:02:00,440 --> 00:02:03,520
hinter der KI, also so ein 
Teilbereich dessen und du kennst

44
00:02:03,520 --> 00:02:05,760
mich ab, Burkhard ne wenn ich 
kurz erzähle, wenn man noch 

45
00:02:05,760 --> 00:02:08,960
weiter reinguckt, also die, die 
die dritte Puppe quasi sich 

46
00:02:09,280 --> 00:02:12,560
anschaut, die 2 obersten 
wegnimmt, dann haben wir im Kern

47
00:02:12,560 --> 00:02:15,440
das Deep Learning und das Deep 
Learning, ist also wieder ein 

48
00:02:15,440 --> 00:02:17,120
Teilbereich des Machine 
Learnings. 

49
00:02:17,400 --> 00:02:20,320
Und bezieht sich auf 
insbesondere neuronale Netze 

50
00:02:20,320 --> 00:02:24,120
beziehungsweise die sehr vielen 
Schichten in diesen neuronalen 

51
00:02:24,120 --> 00:02:25,640
Netzen. 
Ja, da steht einfach das Tip 

52
00:02:25,640 --> 00:02:28,400
für, also das hat mir sehr 
geholfen in der Einordnung, also

53
00:02:28,480 --> 00:02:30,720
worum es überhaupt geht, also es
ist letzten Endes die Technik 

54
00:02:30,960 --> 00:02:33,920
hinter dem, was wir KI. 
Ja, ich will vielleicht noch mal

55
00:02:33,920 --> 00:02:36,720
sagen, KI, wie wir sie heute 
kennen, basiert ja genau auf 

56
00:02:36,720 --> 00:02:40,400
einer Technik des Machine 
Learnings nämlich oder einer 

57
00:02:40,400 --> 00:02:42,200
Methode des des Machine 
Learnings, nämlich den 

58
00:02:42,200 --> 00:02:44,960
neuronalen Netzen. 
Ja, das das ist ja auch nur eine

59
00:02:44,960 --> 00:02:47,520
von vielen, ne, es gibt. 
Es gibt ja viele andere. 

60
00:02:47,520 --> 00:02:50,080
Ja, das Problem ist noch viel 
fundamentaler, ja des des 

61
00:02:50,080 --> 00:02:52,080
Machine Learnings. 
Ja, was ist denn nämlich Machine

62
00:02:52,080 --> 00:02:53,720
Learning, das nur mal ganz kurz 
auf der Tonspur 

63
00:02:53,720 --> 00:02:56,480
auseinanderzunehmen? 
Ja, wir haben ja das explizite 

64
00:02:56,480 --> 00:02:59,920
Programmieren, wo ich dann sage,
wenn das passiert, dann mache 

65
00:02:59,920 --> 00:03:04,360
dieses und so weiter ja, also 
vorhergesagte Logiken und so 

66
00:03:04,360 --> 00:03:06,440
weiter das ist dann überhaupt 
nichts mit Learning, das ist 

67
00:03:06,440 --> 00:03:09,560
dann einfach Machine Programming
und das heißt Machine Learning 

68
00:03:09,560 --> 00:03:13,120
heißt im Prinzip, dass ich 
Programme habe, die. 

69
00:03:13,680 --> 00:03:16,600
Auf Daten reagieren ne. 
Also wenn ich wenn ich wenn ich 

70
00:03:16,600 --> 00:03:18,480
irgendwie mit was mit Machine 
Learning habe, dann hab ich 

71
00:03:18,480 --> 00:03:21,760
immer nen datenproblem ne ich 
hab ich hab irgendwelche Daten 

72
00:03:21,760 --> 00:03:23,840
und ich will irgendwas mit 
diesen Daten machen ne irgendwas

73
00:03:23,840 --> 00:03:26,160
muss ich lernen ne irgendwie was
weiß ich wieviel werden wir 

74
00:03:26,160 --> 00:03:27,560
vielleicht später noch machen 
ich hab zum Beispiel 

75
00:03:27,560 --> 00:03:29,600
irgendwelche Häuser und dann hab
ich irgendwie Parameter ja 

76
00:03:29,600 --> 00:03:32,960
Grundfläche was weiß ich Lage 
und so weiter und sofort dann 

77
00:03:32,960 --> 00:03:34,480
will ich das irgendwie 
optimieren und so weiter also 

78
00:03:34,480 --> 00:03:36,520
ich hab also Daten und irgendwie
was muss aus den Daten 

79
00:03:36,520 --> 00:03:39,200
analysiert werden, das ist halt 
irgendwie Machine Learning und. 

80
00:03:39,360 --> 00:03:42,840
Eine Methode, um, um aus den 
Daten irgendwie Sinn zu bringen 

81
00:03:42,840 --> 00:03:44,880
und sind zu stiften, sind halt 
die neuronalen Netze. 

82
00:03:44,880 --> 00:03:47,480
Es gibt aber auch andere, ja, 
also genau, aber es hat sich 

83
00:03:47,480 --> 00:03:51,280
halt herausgestellt, dass die 
extrem kompetent sind, ja und im

84
00:03:51,280 --> 00:03:53,840
Prinzip bisschen das nachbilden,
was ja auch in der Natur 

85
00:03:53,840 --> 00:03:56,080
passiert, in unserem Gehirn, das
ist ja nicht weit weg, ja, man 

86
00:03:56,080 --> 00:03:59,080
versucht es ja nachzubilden, 
wahrscheinlich nicht ganz dumm 

87
00:03:59,080 --> 00:04:01,320
die Idee, weil wir funktionieren
ja auch ganz gut, unser Gehirn, 

88
00:04:01,320 --> 00:04:04,840
ne also hat sich auch zu einer 
Spezies entwickelt, wir Menschen

89
00:04:04,840 --> 00:04:07,520
selber, die in der Lage sind 
sehr stark zu lernen, ja zum 

90
00:04:07,520 --> 00:04:10,160
Beispiel. 
Sieht man ja ne Natur Werkzeuge 

91
00:04:10,320 --> 00:04:13,040
zu nutzen und so weiter und 
sofort ja, also scheint gut 

92
00:04:13,040 --> 00:04:14,880
also. 
In dem Bild der in dem in dem 

93
00:04:14,880 --> 00:04:17,279
Bild der matroschka Puppen ist 
das jetzt die, die auch die 

94
00:04:17,279 --> 00:04:19,320
dritte Schicht, das ist sowas 
wie das Deep Learning, das sind 

95
00:04:19,320 --> 00:04:22,360
die neuronalen Netze letzten 
Endes ne OKI du wolltest noch ne

96
00:04:22,360 --> 00:04:23,600
normale Scherpuppe. 
Auspacken? 

97
00:04:23,600 --> 00:04:24,960
Ja, gut, ja. 
Nö, wollte ich nicht. 

98
00:04:24,960 --> 00:04:26,920
Ich wollte es nur einordnen, 
weil wir ja so angefangen haben 

99
00:04:26,920 --> 00:04:28,840
mit dem Bild und das ist letzten
Endes die dritte, ne, also es 

100
00:04:28,840 --> 00:04:31,080
ist ein ein Teilbereich des 
maschinellen Lernens, sind die 

101
00:04:31,080 --> 00:04:33,200
neuronalen Netze und die sagst 
du sind heute. 

102
00:04:33,760 --> 00:04:36,680
Dafür verantwortlich, dass wir 
diese großen Durchbrüche haben, 

103
00:04:36,680 --> 00:04:38,800
insbesondere was generative KI 
angeht. 

104
00:04:39,280 --> 00:04:42,000
Ja, ganz genau. 
Also dann gucken wir uns mal 

105
00:04:42,000 --> 00:04:43,560
ganz kurz Geschichte an. 
Da hab ich natürlich auch wieder

106
00:04:43,560 --> 00:04:45,920
so n bisschen rum recherchiert, 
natürlich auch wieder KI 

107
00:04:45,920 --> 00:04:48,400
benutzt, also 
erstaunlicherweise, das war mir 

108
00:04:48,400 --> 00:04:50,560
nicht klar, kann man ganz schön 
weit zurückgehen in der 

109
00:04:50,560 --> 00:04:53,360
Geschichte, also eigentlich bis 
zu den Anfängen von Computern, 

110
00:04:53,680 --> 00:04:57,080
um die ersten 
Forschungsergebnisse oder die 

111
00:04:57,080 --> 00:04:59,560
ersten Überlegungen zu 
maschinellem Lernen eigentlich 

112
00:04:59,560 --> 00:05:02,160
zu finden, das war in den 1900 
50er Jahren schon. 

113
00:05:02,720 --> 00:05:05,520
War dir das klar, dass das zu 
der Zeit schon ein Thema war, 

114
00:05:05,680 --> 00:05:07,120
mit dem sich Menschen 
beschäftigt haben? 

115
00:05:07,840 --> 00:05:09,920
Ja, ich hatte mal. 
Ich hatte mal so von es gibt von

116
00:05:09,920 --> 00:05:13,040
Heise so Kurse und ich hatte 
auch mal so n Machine Learning 

117
00:05:13,040 --> 00:05:15,840
Kurs mir gebucht tatsächlich von
Heise und die hatten auch 

118
00:05:15,840 --> 00:05:17,560
angefangen mit so einer Historie
und da war ich auch ziemlich 

119
00:05:17,560 --> 00:05:19,960
stark verwundert wie wie weit 
das zurückging, aber es war 

120
00:05:19,960 --> 00:05:21,840
schon immer natürlich für die 
Menschen. 

121
00:05:22,280 --> 00:05:24,600
Entspannendes Problem? 
Ja, das ist ja der heilige Gral,

122
00:05:24,600 --> 00:05:27,440
irgendwie aus in den Maschinen 
quasi selber das Lernen 

123
00:05:27,440 --> 00:05:30,040
beizubringen, ja irgendwie und 
aus Daten, das ist ja, das sind 

124
00:05:30,040 --> 00:05:32,960
ja auch die meisten Probleme, ja
das das sehen wir ja da, KI ist 

125
00:05:32,960 --> 00:05:36,000
ja der Einschlag, weil es halt 
irgendwie alle echte Probleme 

126
00:05:36,000 --> 00:05:38,400
löst, die wir so haben. 
Ja, also war schon immer immer 

127
00:05:38,400 --> 00:05:40,640
ne Idee und Wissenschaftler 
haben sich schon immer damit 

128
00:05:40,640 --> 00:05:42,480
befasst, ja. 
Na ja, schon immer. 

129
00:05:42,480 --> 00:05:46,520
Also der Erste war wohl der 
Arthur Samuel in 1952, der den 

130
00:05:46,520 --> 00:05:48,160
Begriff irgendwie geprägt hat, 
Machine Learning. 

131
00:05:48,520 --> 00:05:51,600
Und er hat n Programm entwickeln
wollen was das Spiel Dame 

132
00:05:51,600 --> 00:05:56,360
besonders gut spielt. 
Damit fängt es an und es gab 

133
00:05:56,360 --> 00:05:58,680
dann wohl Phil Ophorie und so 
weiter und irgendwie in den 

134
00:05:58,680 --> 00:06:02,320
Siebzigern und achtzigern 90er 
Jahren, also des 20. 

135
00:06:02,320 --> 00:06:04,640
Jahrhunderts. 
Logischerweise hat man dann 

136
00:06:04,640 --> 00:06:07,600
festgestellt, ah, so einfach ist
es jetzt doch nicht, weil 

137
00:06:07,600 --> 00:06:11,560
insbesondere Rechenleistung 
fehlte und die Algorithmen eben 

138
00:06:11,560 --> 00:06:15,120
noch nicht ausgereift genug 
waren und dann gab es so ne Art 

139
00:06:15,120 --> 00:06:16,560
KI Winter in dieser Zeit, so 
wird das bezeichnet. 

140
00:06:17,880 --> 00:06:22,320
Und erst 2012 kam, wenn man so 
will, der große Big Bang. 

141
00:06:22,720 --> 00:06:26,720
Es ging wieder richtig los vom 
Thema KI, weil 3 Themen 

142
00:06:26,880 --> 00:06:30,720
insbesondere zusammen kamen, 
einmal sind es also die Unmengen

143
00:06:30,720 --> 00:06:33,680
an Daten aus dem Internet, also 
das ist ja letzten Endes die 

144
00:06:33,680 --> 00:06:36,200
Grundlage für alles, was heute 
da ist an an generativer KI, 

145
00:06:36,200 --> 00:06:38,880
insbesondere Internet wird 
einfach eingesaugt und daraus 

146
00:06:38,880 --> 00:06:43,840
gelernt, plötzlich waren die die
Chips zur Verfügung ja Thema 

147
00:06:43,840 --> 00:06:47,360
Nvidia und zwar die die GPUS, 
insbesondere die. 

148
00:06:47,760 --> 00:06:51,280
Aus der Gaming Industrie kamen 
und die Algorithmen hatten sich 

149
00:06:51,280 --> 00:06:53,920
verbessert und hier ist das 
Thema Deep Learning oder 

150
00:06:54,080 --> 00:06:55,760
neuronale Netze dann das 
Entscheidende. 

151
00:06:56,160 --> 00:06:58,440
Ja und dann ging das wohl 
relativ zügig, wie wir jetzt 

152
00:06:58,440 --> 00:07:01,360
merken, von 2012 bis heute 
weiter, bis wir jetzt alle mit 

153
00:07:01,520 --> 00:07:03,040
CGPT und Co. 
Arbeiten. 

154
00:07:03,760 --> 00:07:05,920
Ja, das ist krass, wenn man das 
auf der Zeitleiste aufzeichnet. 

155
00:07:05,920 --> 00:07:07,280
Da gab es ja wirklich n Big 
Bang. 

156
00:07:07,280 --> 00:07:09,600
Ja, es explodierte dann ja, ich 
glaube aber was nicht genau an 

157
00:07:09,600 --> 00:07:11,760
diesen Sachen da kam, das kam 
halt dann alles zusammen. 

158
00:07:11,760 --> 00:07:14,400
Ja, wir hatten Daten, wir hatten
die Möglichkeit die Daten zu 

159
00:07:14,400 --> 00:07:16,600
berechnen mit den Algorithmen, 
die Algorithmen waren halt auch 

160
00:07:16,600 --> 00:07:18,560
schon lange. 
Durch die Wissenschaftlerhänder 

161
00:07:18,560 --> 00:07:21,000
gegangen und gut optimiert. 
Ja, es passiert natürlich, aber 

162
00:07:21,000 --> 00:07:22,960
heute andauernd ja immer noch 
irgendwas. 

163
00:07:22,960 --> 00:07:25,760
Ja, also ich glaube wir sind 
gerade so am Anfang von dem das 

164
00:07:25,760 --> 00:07:27,640
so richtig abgeht. 
Ja ich glaub da passiert noch ne

165
00:07:27,640 --> 00:07:29,080
ganze Menge in den nächsten 
Jahren auch. 

166
00:07:29,200 --> 00:07:31,960
Sich jetzt zu denken, dass wir 
dass jetzt alles passiert ist, 

167
00:07:31,960 --> 00:07:34,240
das wär natürlich denkbar 
falsch, ja. 

168
00:07:34,640 --> 00:07:36,480
Ja. 
Jetzt wird ja auch gesehen, was 

169
00:07:36,480 --> 00:07:38,920
da an an Returns quasi 
eingespielt werden kann. 

170
00:07:38,920 --> 00:07:42,080
Also die Leute sind bereit für 
KI basierte Software zum 

171
00:07:42,080 --> 00:07:44,480
Beispiel. 
Geld auszugeben ja, und nicht 

172
00:07:44,480 --> 00:07:45,880
nur die Leute, sondern sondern 
die Firmen. 

173
00:07:45,880 --> 00:07:47,680
Und dann geht es ja alles 
richtig los, quasi ich. 

174
00:07:48,000 --> 00:07:49,160
Hab fast das Gefühl, jetzt haben
wir. 

175
00:07:49,160 --> 00:07:51,080
Jetzt haben wir n Überschwung, 
so dass wir, dass wir jetzt 

176
00:07:51,080 --> 00:07:53,960
gerade mehr Lösungen haben, als 
dass wir die Probleme schon 

177
00:07:53,960 --> 00:07:56,160
irgendwie gefunden haben. 
Alle, die wir damit cool lösen 

178
00:07:56,160 --> 00:07:59,720
können, ne also es ist es 
schwingt gerade fast in die 

179
00:07:59,720 --> 00:08:02,120
andere Richtung, ne, aber genau 
da wird noch viel kommen. 

180
00:08:02,120 --> 00:08:04,080
Ja es kommt ja auch viel, wir 
sehen es ja in unseren mit 

181
00:08:04,720 --> 00:08:07,000
mitverdienern sag ich immer die 
ganzen Start Ups und so weiter 

182
00:08:07,000 --> 00:08:10,800
es gibt ja sehr viele die da die
irgendwie ne neue Idee haben wie

183
00:08:10,800 --> 00:08:12,560
jetzt KI eingesetzt werden kann 
ne und? 

184
00:08:13,520 --> 00:08:15,600
Sinn bringt ja. 
Kennst du den Hype Cycle, den 

185
00:08:15,600 --> 00:08:18,240
Gardner Hype Cycle? 
Ja, den kenn ich natürlich ja. 

186
00:08:18,400 --> 00:08:20,440
Ja, es fühlt sich so an, als 
wären wir gerade ganz oben auf 

187
00:08:20,440 --> 00:08:22,640
dem Hype so ne und dann wird es 
noch mal durch so n kleines Tal 

188
00:08:22,640 --> 00:08:26,080
gehen, aber wer weiß, ja ja ja. 
Jetzt kommt ja auch gerade in in

189
00:08:26,080 --> 00:08:27,920
linkedin und so weiter überall. 
Ich krieg andere auch die 

190
00:08:27,920 --> 00:08:30,920
Nachrichten, ja platzt jetzt die
KI blase und so weiter ja ist es

191
00:08:30,920 --> 00:08:32,400
überhaupt ne Blase oder wie auch
was? 

192
00:08:32,400 --> 00:08:35,600
Ja wir werden sehen. 
Ja genau, wir werden sehen. 

193
00:08:35,760 --> 00:08:38,240
Darüber müssen sich andere 
Podcasts und und Menschen 

194
00:08:38,240 --> 00:08:40,159
Gedanken machen. 
Ne, das machen wir jetzt. 

195
00:08:40,400 --> 00:08:43,120
Genau, wir kommen jetzt mal zur 
Technik, da füllen wir uns zu 

196
00:08:43,200 --> 00:08:47,000
Hause, zumindest fühlst du dich 
da zu Hause und lass uns doch 

197
00:08:47,000 --> 00:08:49,800
mal die die Arten des 
Maschinenlernens durchgehen, ne,

198
00:08:49,800 --> 00:08:52,960
also es gibt das überwachte 
lernen, also superwise Learning,

199
00:08:53,440 --> 00:08:56,160
das un superwise Learning und 
das also das Unüberwachte 

200
00:08:56,160 --> 00:08:59,600
lernen, wenn man das übersetzen 
möchte und das re enforcement 

201
00:08:59,600 --> 00:09:02,200
learning das bestärkende lernen.
Ich würd sagen jetzt gehen wir 

202
00:09:02,200 --> 00:09:06,160
die mal durch und erklär mal was
steckt da jeweils hinter ja 

203
00:09:06,160 --> 00:09:09,520
genau also. 
Es gibt diese 3 Methoden aber 

204
00:09:09,520 --> 00:09:11,720
die auch so die 3 
Anwendungsfälle und so weiter 

205
00:09:11,720 --> 00:09:13,200
sind auch komplett 
unterschiedlich. 

206
00:09:13,200 --> 00:09:15,440
Ja also die die muss man 
wirklich auseinander dividieren 

207
00:09:15,440 --> 00:09:18,000
und es ist auch es sind nicht 3 
Methoden um das gleiche Problem 

208
00:09:18,000 --> 00:09:20,560
zu lösen, sondern es sind 3 
Methoden die auch 3 verschiedene

209
00:09:20,560 --> 00:09:23,040
Problemaspekte behandeln. 
Ja und? 

210
00:09:23,440 --> 00:09:26,240
Also muss verschiedene. 
Muss ich erstmal darüber im 

211
00:09:26,240 --> 00:09:28,640
Klaren sein, was ist eigentlich 
mein Problem und dann kann ich 

212
00:09:28,640 --> 00:09:30,400
überlegen, welche Methode nutze 
ich dafür. 

213
00:09:30,800 --> 00:09:34,040
Ganz genau, oder? 
Ja, richtig, also irgendwas 

214
00:09:34,040 --> 00:09:35,640
willst du lösen und dann musst 
du gucken, was ist. 

215
00:09:35,640 --> 00:09:38,080
Was ist das ne zum Beispiel, du 
hast jetzt gesagt Dame Spiel 

216
00:09:38,080 --> 00:09:40,880
oder irgendsowas ja Schachspiel 
also wenn du jetzt so n wenn du 

217
00:09:40,880 --> 00:09:43,240
n wenn du jetzt n robotischen 
Schachspieler haben willst oder 

218
00:09:43,240 --> 00:09:46,040
irgendsowas ja dann sind wir 
ganz schnell beim Re enforcement

219
00:09:46,040 --> 00:09:49,840
learning, ja weil da da hast du 
ganz oft das Problem, ist halt 

220
00:09:49,840 --> 00:09:52,760
durch Trial and error ja weil du
weißt jetzt immer Schachspiel 

221
00:09:52,760 --> 00:09:55,200
ist das krasse Ding ja du machst
halt zum Beispiel viele Züge, 

222
00:09:55,200 --> 00:09:58,640
opferst Bauern und so weiter und
stellst erst ganz am Ende fest. 

223
00:09:58,640 --> 00:10:00,880
OK das war aber trotzdem 
insgesamt sinnvoll. 

224
00:10:01,280 --> 00:10:03,160
Ich hab dich dann doch noch 
schachmatt gesetzt und so weiter

225
00:10:03,160 --> 00:10:06,440
ja, das ist halt von der ganzen 
denke und so weitergibst du 

226
00:10:06,440 --> 00:10:09,520
natürlich immer Belohnungen. 
Ja hast du guten Zug gemacht und

227
00:10:09,520 --> 00:10:12,240
dann wieder gibt es auch wieder 
Bestrafung weil weil du 

228
00:10:12,240 --> 00:10:14,440
irgendwas verloren hast und so 
weiter aber es ist dann doch 

229
00:10:14,440 --> 00:10:16,880
noch komplex, weil das quasi 
alles auch noch über einen 

230
00:10:16,880 --> 00:10:20,080
Zeitstrahl aufgespart werden 
muss und du kannst ja auch 

231
00:10:20,240 --> 00:10:24,080
kleine Bestrafung quasi 
akzeptieren, sag ich mal um dann

232
00:10:24,080 --> 00:10:26,640
trotzdem das Spiel zu gewinnen. 
Ja, je nach Komplexität des 

233
00:10:26,640 --> 00:10:29,360
Spiels bei Schach ist es zum 
Beispiel so, ja das ist ne ganz 

234
00:10:29,360 --> 00:10:32,000
eigene. 
Ganz, ganz eigene Art der 

235
00:10:32,000 --> 00:10:34,600
Algorithmiken, die dahinter 
stehen und so weiter dieses Re 

236
00:10:34,600 --> 00:10:38,200
Enforcement Learning ja also zum
also Spiele spiele Sachen zum 

237
00:10:38,200 --> 00:10:40,320
Beispiel und auch in der 
Industrie gibt es so n Klassiker

238
00:10:40,320 --> 00:10:43,520
Roboter ne die die irgendwie was
picken sollen oder irgendsowas 

239
00:10:43,520 --> 00:10:45,640
ne die haben ja relativ viele 
Achsen am Arm und so weiter und 

240
00:10:45,640 --> 00:10:47,240
wenn die irgendwas bestimmtes 
machen sollen die werden 

241
00:10:47,240 --> 00:10:50,440
tatsächlich manchmal von 
Menschen geführt um um um die 

242
00:10:50,440 --> 00:10:53,920
Sachen richtig zu machen und da 
wird quasi das ähnliches Konzept

243
00:10:53,920 --> 00:10:57,480
ja also greift daneben und dann 
korrigierst du ihn in dem Moment

244
00:10:57,480 --> 00:11:00,080
und so weiter ja das. 
Ganz eigene Klasse von von 

245
00:11:00,080 --> 00:11:03,520
Machine Learning Kategorien, ne.
OK, also dann lass uns doch mal 

246
00:11:03,520 --> 00:11:05,440
mit dem kurz anfangen mit dem 
Reforcement Learning. 

247
00:11:05,440 --> 00:11:07,840
Also ich find das find das mit 
den Spielen total cool, da gab 

248
00:11:07,840 --> 00:11:10,280
es ja auch den Moment wo 
plötzlich ne KI oder oder ne 

249
00:11:10,280 --> 00:11:14,680
Maschine letzten Endes den 
Schach Obermeister besiegt hatte

250
00:11:14,680 --> 00:11:17,520
und dann gab es noch mal n paar 
Jahre später dann gab es quasi 

251
00:11:17,520 --> 00:11:21,440
das Thema wo die KI diesen Go 
Spieler also go ist ja noch mal 

252
00:11:21,440 --> 00:11:24,000
dieses also. 
Viel kompliziertere Spiele 

253
00:11:24,000 --> 00:11:26,080
anscheinend als Fach. 
Ich kenne es nicht, aber was man

254
00:11:26,080 --> 00:11:28,000
auch lernen kann und wo dann 
auch immer der Computer gesagt 

255
00:11:28,000 --> 00:11:30,880
hat okay ich bin jetzt also wer 
hat den einfach gewonnen und es 

256
00:11:31,040 --> 00:11:34,080
gibt noch ein anderes Beispiel, 
es gibt ne KI die hat Super 

257
00:11:34,080 --> 00:11:36,920
Mario durchgespielt, so schnell 
wie noch nie ein Mensch zuvor 

258
00:11:36,920 --> 00:11:40,000
und dann haben wir gesagt okay 
krass, also wenn die das können 

259
00:11:40,000 --> 00:11:43,080
die Maschinen ja, also dann ist 
aber bald vorbei mit der 

260
00:11:43,080 --> 00:11:45,200
Menschheit, ja dann übernehmen 
die wirklich wie bei der Matrix 

261
00:11:45,200 --> 00:11:47,760
oder so. 
Aber stellt sich raus, die 

262
00:11:47,760 --> 00:11:49,920
können halt einfach nur gut 
Schach spielen oder gut Go 

263
00:11:49,920 --> 00:11:52,560
spielen oder gut Super Mario die
jeweilige KI, aber sonst halt 

264
00:11:52,560 --> 00:11:56,400
auch einfach nichts und warum, 
das ist halt das wo ich dachte 

265
00:11:56,400 --> 00:11:58,480
krass, das ist es eigentlich das
Dream Force Blearning die haben 

266
00:11:58,480 --> 00:12:00,760
halt das sind halt 
computergesteuerte, die können 

267
00:12:00,760 --> 00:12:04,120
halt beliebig viele Partien wenn
man so möchte parallel spielen, 

268
00:12:04,120 --> 00:12:08,640
das heißt die haben jegliche 
Möglichkeit dieses Spiel zu 

269
00:12:08,640 --> 00:12:11,600
spielen, einmal durchgespielt 
vielleicht sogar. 

270
00:12:11,600 --> 00:12:13,120
Mehrfach, so ist es im Prinzip 
auch, ja. 

271
00:12:13,560 --> 00:12:15,520
Genau, und dadurch wären die 
einfach total gut und das hat n 

272
00:12:15,520 --> 00:12:18,120
Mensch gar nicht die Möglichkeit
in seinem Leben so oft diese 

273
00:12:18,120 --> 00:12:20,960
Partien zu spielen. 
Ja, das ist richtig, genau. 

274
00:12:21,040 --> 00:12:24,320
Ja, ja, es es funktioniert also 
wirklich ganz anders. 

275
00:12:24,320 --> 00:12:27,360
Also man hat also so technisch 
hat man halt so 5 beim 

276
00:12:27,520 --> 00:12:30,480
Greenforcement lernt man immer 
so 5 kernkonzepte ja, du hast 

277
00:12:30,480 --> 00:12:33,840
halt irgendwie den Agenten, so 
sagt man halt, das ist quasi das

278
00:12:33,840 --> 00:12:37,280
das das Machine Learning Modell 
ja und dann hast du halt die 

279
00:12:37,280 --> 00:12:39,840
Umgebung. 
Also die, die die Welt, in der 

280
00:12:39,840 --> 00:12:42,240
der Agent Halt gesetzt wird. 
Ja, das ist also quasi das 

281
00:12:42,240 --> 00:12:45,600
Schachbrett oder das Labyrinth 
oder dein dein dein go Spiel 

282
00:12:45,600 --> 00:12:48,760
oder wie auch immer, ja ist, ist
quasi die Umgebung und dann hast

283
00:12:48,760 --> 00:12:52,240
du halt n Zustand als als 
dritten, als drittes 

284
00:12:52,240 --> 00:12:56,600
Kampfkonzept der Zustand ist 
halt quasi der jetzige Zustand 

285
00:12:56,600 --> 00:13:00,400
des Schachbretts, also quasi die
Position aller Spielfiguren im 

286
00:13:00,400 --> 00:13:03,520
im Moment x. 
Ja und dann hast du die Aktion 

287
00:13:04,000 --> 00:13:06,560
also und das ist quasi eine 
Liste der möglichen Aktionen. 

288
00:13:06,640 --> 00:13:08,680
Gegeben einem Zustand, ja, kann 
sich das Ganze. 

289
00:13:08,680 --> 00:13:11,280
Ja, das hat natürlich ganz viel 
mit den Regeln zu tun von dem 

290
00:13:11,280 --> 00:13:12,720
Spiel was du da optimierst und 
so. 

291
00:13:12,720 --> 00:13:16,080
Ja und dann hast du doch als 
fünftes Konzept die Belohnung 

292
00:13:16,640 --> 00:13:20,400
als einziges Feedback, dass der 
Agent quasi erhält das Modell 

293
00:13:20,400 --> 00:13:24,160
ja, also es passiert ja immer 
gegeben, einem Zustand wird, der

294
00:13:24,240 --> 00:13:28,360
wird der Agent eine Aktion 
auslösen und die war entweder 

295
00:13:28,360 --> 00:13:31,120
gut oder schlecht und du gibst 
im Prinzip n ziemlich einfaches 

296
00:13:31,120 --> 00:13:34,280
Feedback. 
Ja, also plus 1 für cool -1 für 

297
00:13:34,280 --> 00:13:36,920
das war Mist. 
Oder, oder, oder irgendwie 0, 

298
00:13:36,920 --> 00:13:40,000
wenn wenn irgendwas dazwischen 
war, so ja, also Ziel quasi so 

299
00:13:40,000 --> 00:13:42,760
von so einem Training ist halt 
in in dem Reinforcement Learn 

300
00:13:42,760 --> 00:13:45,360
nicht einen Wert vorherzusagen, 
wie das halt irgendwie bei den 

301
00:13:45,360 --> 00:13:48,080
ganzen anderen KI Modellen und 
so weiter ist ja wie wie 

302
00:13:48,080 --> 00:13:50,160
irgendwie n hauspreis oder sowas
bei einer Regression oder 

303
00:13:50,160 --> 00:13:52,400
irgendwie ne oder wie das 
nächste Wort bei einem großen 

304
00:13:52,400 --> 00:13:56,320
Sprachmodell ja das ist ja quasi
ne ne Vorhersage was macht jetzt

305
00:13:56,320 --> 00:13:57,960
als nächstes Sinn? 
Ja das ist nicht die Idee 

306
00:13:57,960 --> 00:14:01,600
sondern. 
Die Idee ist quasi ne optimale 

307
00:14:01,600 --> 00:14:04,240
Strategie zu lernen. 
Ja man sagt auch Policy im 

308
00:14:04,240 --> 00:14:08,200
englischen ja wie ich jetzt 
quasi so nen Spiel so n 

309
00:14:08,200 --> 00:14:11,320
Schachspiel quasi lerne ja weil 
halt die Strategie hab ich ganz 

310
00:14:11,320 --> 00:14:13,640
am Anfang gesagt, die kann das 
ist n bisschen komplexer weil 

311
00:14:13,640 --> 00:14:16,720
ich muss halt andauernd quasi 
die Zeit mitnehmen, es kann es 

312
00:14:16,720 --> 00:14:18,880
kann halt ne gute Strategie sein
am Anfang zum Beispiel viele 

313
00:14:18,880 --> 00:14:21,320
Figuren zu verlieren und zum 
Schluss die richtigen zu 

314
00:14:21,320 --> 00:14:23,000
behalten und dich dann doch noch
mal zu setzen. 

315
00:14:23,000 --> 00:14:25,520
Wir wissen ja selber wie komplex
Schachspielen ist. 

316
00:14:25,520 --> 00:14:28,480
Zum Beispiel Ja. 
Da wollte ich kurz einhaken. 

317
00:14:28,800 --> 00:14:31,240
Ja, weil. 
Das klang jetzt so in deiner 

318
00:14:31,240 --> 00:14:33,560
Beschreibung, als wär jetzt nach
jedem, um beim Schach zu 

319
00:14:33,560 --> 00:14:36,560
bleiben, nach jedem Zug ne 
Stunde Feedback vorhanden, 10 

320
00:14:36,560 --> 00:14:40,600
oder oder -1. 
Manchmal gerade beim Schach weiß

321
00:14:40,600 --> 00:14:43,000
ich das ja noch nicht, wie du 
gerade sagst, war das jetzt gut,

322
00:14:43,000 --> 00:14:45,360
das weiß ich vielleicht erst 5 
Wochen später oder vielleicht 

323
00:14:45,360 --> 00:14:47,600
weiß ich es sogar erst am Ende 
des Spiels, wo ich meinen Gegner

324
00:14:47,680 --> 00:14:50,640
Schach mattgestellt habe, das 
heißt ich kann das auch im 

325
00:14:50,640 --> 00:14:53,000
Nachgang noch erfahren, also ich
kann erst mehrere Züge 

326
00:14:53,000 --> 00:14:55,960
durchführen oder diese werden 
als ein Zug betrachtet im im 

327
00:14:55,960 --> 00:14:58,200
Sinne der der Technik oder 
Mathematik und am Ende gibt es n

328
00:14:58,200 --> 00:14:59,440
Feedback war das gut oder 
schlecht? 

329
00:15:00,320 --> 00:15:02,640
Richtig, das stimmt. 
Gerrit, und deswegen sind auch 

330
00:15:02,640 --> 00:15:04,600
diese, du hast ja auch was 
gesagt, ganz am Anfang ist 

331
00:15:04,600 --> 00:15:06,920
natürlich auch wahr, die die 
Dinger werden halt gut, wenn sie

332
00:15:06,920 --> 00:15:09,120
halt milliardenfach irgendwie 
das Spiel gemacht haben, ja, 

333
00:15:09,360 --> 00:15:11,720
aber es ist trotzdem so, nach 
jedem, nach jeder Aktion, nach 

334
00:15:11,720 --> 00:15:14,640
jedem Zug gibt es irgendwie ne 
Bewertung, ja die selbst diese 

335
00:15:14,640 --> 00:15:17,520
Bewertung kann dann aber auch, 
muss quasi auch gewichtet werden

336
00:15:17,520 --> 00:15:20,240
ja kann gut oder schlecht sein 
ja wenn du zum Beispiel n Zug 

337
00:15:20,240 --> 00:15:22,640
machst der irgendwie einfach nur
nach vorne zieht und keinen 

338
00:15:22,640 --> 00:15:25,680
gegnerischen Spielfigur schlägt,
ja dann ist die hat die 

339
00:15:25,680 --> 00:15:28,160
vielleicht irgendwie so nen 
neutralen wert sag ich mal als 

340
00:15:28,160 --> 00:15:30,480
Bewertung ja. 
Und wenn du n Gegner schlägst, 

341
00:15:30,480 --> 00:15:33,040
dann gibt es vielleicht plus 1. 
Ja während du n Gegner Matt 

342
00:15:33,040 --> 00:15:34,320
setzt. 
Dann gibt es halt irgendwie noch

343
00:15:34,320 --> 00:15:38,160
mal plus 100 oder irgendwie ja 
als Belohnung weißt du und und 

344
00:15:38,160 --> 00:15:41,400
was passiert technisch ist, dass
wenn da so n Ding anfängt ist es

345
00:15:41,400 --> 00:15:43,840
natürlich maximal blöd, das wird
halt nicht gut Schach spielen ja

346
00:15:44,560 --> 00:15:47,360
so wie wenn du jemals sagst hier
ist n Schachspieler so hier sind

347
00:15:47,360 --> 00:15:49,560
die Regeln, so darfst du ziehen,
so mach mal ja der wird halt 

348
00:15:49,560 --> 00:15:53,320
verlieren ja gegen den guten 
Schachspieler ja und so verliert

349
00:15:53,320 --> 00:15:56,160
halt quasi auch die künstliche 
der künstliche Intelligenz 

350
00:15:56,160 --> 00:15:59,160
Schachspieler sag ich mal ja. 
Aber was jetzt passiert ist 

351
00:15:59,160 --> 00:16:02,800
quasi diese Belohnung oder 
Bestrafung, die werden 

352
00:16:02,800 --> 00:16:06,800
gespeichert, und zwar nicht nur 
einmal für diesen Zug, sondern 

353
00:16:06,800 --> 00:16:09,920
die ganze Historie, das ganze 
Spiel wird quasi festgehalten 

354
00:16:10,000 --> 00:16:14,480
und du hast ja ne Kombinatorik, 
also Zustand mögliche Aktion ja 

355
00:16:14,960 --> 00:16:18,000
und quasi jede mögliche Aktion 
gegeben, einem möglichen 

356
00:16:18,000 --> 00:16:20,240
Zustand, das wird quasi ne 
Matrix. 

357
00:16:20,240 --> 00:16:23,160
Ja du hast dann irgendwie die 
Zustände als Zeilen und die und 

358
00:16:23,160 --> 00:16:25,520
die die möglichen Aktionen als 
Spalten. 

359
00:16:26,240 --> 00:16:28,640
Und da ist am Anfang alles leer.
Ja, aber wenn du das jetzt quasi

360
00:16:28,640 --> 00:16:31,520
tausendmal durchgehst, dann 
kannst du quasi diese Belohnung 

361
00:16:31,920 --> 00:16:34,800
und die Bestrafung und so weiter
aufbauen als Matrix über alle 

362
00:16:34,800 --> 00:16:37,480
Züge, über alle Aktionen von 
gegeben allen Zuständen, das 

363
00:16:37,480 --> 00:16:40,160
wird halt n fettes Teil. 
Ja und da stehen dann aber quasi

364
00:16:40,160 --> 00:16:42,400
deine ganzen Gewichte drin und 
so weiter und dann kannst du 

365
00:16:42,400 --> 00:16:45,480
quasi rückwärts gucken und das 
passiert dann auch, wenn das 

366
00:16:45,480 --> 00:16:48,080
dann cleverer wird, dann kann 
das, dann guckt es quasi schon 

367
00:16:48,080 --> 00:16:50,960
in dieser, in dieser großen 
Tabelle, ja die nennt man Q 

368
00:16:50,960 --> 00:16:53,680
Table glaub ich bin jetzt auch 
nicht der Experte, ja. 

369
00:16:54,080 --> 00:16:56,960
Guckt man quasi, wenn ich das 
und das mache, wie würde denn 

370
00:16:56,960 --> 00:16:59,680
dann das vielleicht später 
aussehen können und so weiter ja

371
00:17:00,080 --> 00:17:02,040
ist ne ganz andere Art von von 
Gedanken. 

372
00:17:02,040 --> 00:17:05,040
Ja und wo kommt da KI ins Spiel?
Wir wollen das jetzt da hier 

373
00:17:05,040 --> 00:17:07,760
nicht technisch zu tief machen, 
aber das Problem ist wenn ich 

374
00:17:07,760 --> 00:17:09,640
jetzt so ganz komplexe Probleme 
hab, dann kannst du dir 

375
00:17:09,640 --> 00:17:13,280
vorstellen Gerrit diese Matrize 
an Kombinatorik und an an 

376
00:17:13,280 --> 00:17:15,200
Gewicht und so weiter die wird 
halt auch schon sehr sehr 

377
00:17:15,200 --> 00:17:18,480
komplex ja und alleine dann 
quasi für den nächsten für die 

378
00:17:18,480 --> 00:17:21,040
nächste Aktion zu entscheiden, 
was tue ich denn jetzt hier 

379
00:17:21,040 --> 00:17:24,800
gegeben dieser gigantischen. 
Historie quasi an an 

380
00:17:24,800 --> 00:17:27,800
Möglichkeiten die ich da hab ist
dann auch schon schwierig und da

381
00:17:27,800 --> 00:17:30,040
wird dann quasi dann noch mal ne
KI drauf gesetzt. 

382
00:17:30,040 --> 00:17:32,960
Das macht dann quasi wieder n 
neuronales Netz, das optimiert 

383
00:17:32,960 --> 00:17:37,040
dann quasi die das bewegen quasi
in dieser in dieser 

384
00:17:37,440 --> 00:17:40,440
gespeicherten Tabelle, wo quasi 
die ganzen Bestrafungen und so 

385
00:17:40,440 --> 00:17:42,880
weiter da drin drin stehen. 
Ja Bestrafung und Belohnung ja 

386
00:17:42,880 --> 00:17:45,320
für den für was ist dann die 
nächste Aktion die Beste? 

387
00:17:45,320 --> 00:17:48,640
Ja so ganz grob gesprochen ja 
bisschen vereinfacht oder wir 

388
00:17:48,640 --> 00:17:50,440
müssen n bisschen aufpassen, 
aber es ist unglaublich 

389
00:17:50,440 --> 00:17:52,240
schwierig Machine Learning. 
Ist halt. 

390
00:17:52,240 --> 00:17:55,440
Am Ende ist es halt viel 
Mathematik und es gibt auch viel

391
00:17:55,440 --> 00:17:57,120
Algorithmik da und viele 
Möglichkeiten. 

392
00:17:57,120 --> 00:17:59,920
Man kann es, man kann es nur so 
n bisschen anteasern sag ich mal

393
00:17:59,920 --> 00:18:01,120
wie es ungefähr funktioniert, 
ja. 

394
00:18:01,520 --> 00:18:04,280
Das OK denk ich dann der Teaser,
den hab ich schon verstanden, 

395
00:18:04,280 --> 00:18:07,560
das war schon ziemlich cool und 
ja man kann eigentlich sagen man

396
00:18:07,560 --> 00:18:11,760
kann es immer da nutzen wo wo es
echt viele Wege gibt die so zum 

397
00:18:11,760 --> 00:18:15,120
Ziel führen. 
Unfassbar viele Kombinationen 

398
00:18:15,120 --> 00:18:18,640
sind da ja möglich, also vom 
Schach beim Go beim Super Mario 

399
00:18:18,640 --> 00:18:20,600
Ne wenn man sich das vorstellt, 
die Kombinationen sind da 

400
00:18:20,600 --> 00:18:23,080
drücken von. 
Knopf folgen letzten Endes auf 

401
00:18:23,080 --> 00:18:26,640
dem Controller kann man genauso 
betrachten oder du hast das 

402
00:18:26,640 --> 00:18:29,560
Roboterbeispiel gebracht. 
Roboter greift in ne Kiste mit 

403
00:18:29,560 --> 00:18:32,400
Bällen oder steht sich so n 
Jahrmarktroboter vor wo man n 

404
00:18:32,400 --> 00:18:34,880
Euro reinschmeißt oder 2 und 
dann will man sich so n kleines 

405
00:18:34,880 --> 00:18:37,680
Kuscheltier da rausziehen, das 
könnte man ja auch einer KI 

406
00:18:37,680 --> 00:18:40,720
überlassen, einfach perfekt. 
Quasi Reinzufahren und zu 

407
00:18:40,720 --> 00:18:42,240
greifen. 
Und um immer sicher n 

408
00:18:42,240 --> 00:18:44,240
Kuscheltier Rauszugeben 
rauszunehmen ne richtig. 

409
00:18:44,240 --> 00:18:45,440
Genau. 
Und aber da haben wir genauso 

410
00:18:45,440 --> 00:18:47,880
wie beim Spiel ne, das ist ja 
quasi auch über die Zeit ne, ich

411
00:18:47,880 --> 00:18:50,440
muss ja ich, ich mach ja nicht 
nur eine Aktion, sondern ich 

412
00:18:50,440 --> 00:18:53,760
mache ganz viele Aktionen, ne 
ich beweg den Arm dahin, ich 

413
00:18:53,760 --> 00:18:56,160
zeig ihm genau über so n 
Kuscheltier, dann setz ich ihn 

414
00:18:56,160 --> 00:18:58,800
runter, mach das Ding zu und so 
weiter das muss ich ja quasi 

415
00:18:58,800 --> 00:19:00,600
alles lernen, ne? 
Wobei dich hisst jetzt Schwein, 

416
00:19:00,600 --> 00:19:02,640
fällt mir gerade ein. 
Ist halt n bisschen Eiern, aber 

417
00:19:02,640 --> 00:19:04,720
die Kuscheltiere liegen ja nicht
immer gleich. 

418
00:19:04,720 --> 00:19:06,360
Das ist ja nicht wieso n 
Eierkarton die alle genau 

419
00:19:06,360 --> 00:19:08,480
nebeneinander sitzen mit dem 
gleichen Abstand oder sowas, 

420
00:19:08,640 --> 00:19:10,080
sondern die liegen ja wild da 
drinne. 

421
00:19:10,560 --> 00:19:11,840
Ja, das ist das. 
Genau ja. 

422
00:19:12,240 --> 00:19:13,840
Aber das ist auch das. 
Ist ja wie beim Schachspiel. 

423
00:19:13,840 --> 00:19:16,080
Ne du, das ist ja auch nicht 
immer gleich wie dein Gegner 

424
00:19:16,080 --> 00:19:17,760
aufzieht. 
Ja das das das ist quasi die 

425
00:19:17,760 --> 00:19:20,160
Analogie. 
Ja also und klar hast du da n 

426
00:19:20,160 --> 00:19:22,480
Sensor, der Roboter alleine wird
es nicht können ja du musst ihm 

427
00:19:22,480 --> 00:19:26,000
schon auch ne Kamera hinmachen 
wo der irgendwie sieht was wie 

428
00:19:26,000 --> 00:19:28,480
liegen die Kuscheltiere quasi ja
an der Stelle ja genau. 

429
00:19:28,960 --> 00:19:31,360
Ja, aber ich glaube sogar, das 
wäre schon n krasser Fall. 

430
00:19:31,360 --> 00:19:34,120
Aber was ich immer so gesehen 
hab, was die Roboter können, die

431
00:19:34,120 --> 00:19:35,680
die haben schon eigentlich n 
festen. 

432
00:19:35,760 --> 00:19:38,120
Also wenn dieses Picking quasi 
passiert da dann haben die schon

433
00:19:38,120 --> 00:19:40,240
n festen Platz wo da irgendwie 
das Werkstück oder was auch 

434
00:19:40,240 --> 00:19:42,520
immer was die picken sollen da 
schon an der Stelle drauf ist. 

435
00:19:42,520 --> 00:19:45,120
Ja jetzt wird das Problem auch 
zu hochdimensional muss auch. 

436
00:19:45,600 --> 00:19:47,040
Ja, aber eben nicht 
millimetergenau. 

437
00:19:47,040 --> 00:19:48,600
Da sind wir ja wieder, sondern 
irgendwie verteilt. 

438
00:19:49,040 --> 00:19:50,640
Ganz genau, ganz genau, ganz 
genau. 

439
00:19:50,640 --> 00:19:53,440
Ja, das stimmt. 
OK, cool, also perfekt real 

440
00:19:53,440 --> 00:19:56,480
forcement Learning verstanden 
ist n bisschen zuckerrot und 

441
00:19:56,480 --> 00:20:00,080
Peitsche Prinzip genau. 
Ki kriegt einen offen Latz, wenn

442
00:20:00,080 --> 00:20:02,480
es falsch war oder kriegt halt 
lecker Belohnungen, wenn es gut 

443
00:20:02,480 --> 00:20:05,600
war. 
Ein kurzer Hinweis in eigener 

444
00:20:05,600 --> 00:20:07,640
Sache. 
Kennst du das auch, dass von 

445
00:20:07,640 --> 00:20:09,920
neuer Software zur 
Digitalisierung der Produktion 

446
00:20:09,920 --> 00:20:12,120
zurückgeschreckt wird? 
Ihr seid gefangen zwischen 

447
00:20:12,120 --> 00:20:15,120
starrer, veralteter 
Standardsoftware und endlosen 

448
00:20:15,120 --> 00:20:18,360
Individualentwicklungsprojekten 
unsere Mission bei Heisenware 

449
00:20:18,360 --> 00:20:22,080
ist es, das zu beenden mit 
unserem App Baukasten geben wir 

450
00:20:22,080 --> 00:20:24,720
dir die Möglichkeit, 
maßgeschneiderte Software für 

451
00:20:24,720 --> 00:20:27,840
den Shopfloor schnell und ohne 
Code zu erstellen. 

452
00:20:28,280 --> 00:20:31,000
Denk an Maschinendatenerfassung 
moderne Visualisierungen für die

453
00:20:31,000 --> 00:20:33,600
Produktionsleiter oder eine 
mobile App zur Buchung von 

454
00:20:33,600 --> 00:20:37,520
Zeiten direkt am Arbeitsplatz 
und das beste, du kannst deine 

455
00:20:37,520 --> 00:20:40,640
Lösung ganz einfach ohne it 
Aufwand selbst betreiben. 

456
00:20:40,960 --> 00:20:44,720
Kurz gesagt, günstiger als eine 
externe Entwicklung unendlich 

457
00:20:44,720 --> 00:20:46,560
passender als Software von der 
Stange. 

458
00:20:46,640 --> 00:20:50,000
Weitere Infos und eine 
kostenlose 30 Tage Testphase 

459
00:20:50,000 --> 00:20:53,120
findest du auf heisenware.com 
einfach minus komplex. 

460
00:20:54,240 --> 00:20:57,920
Als Träumhörer bieten wir dir im
Anschluss 20% Rabatt auf alle 

461
00:20:57,920 --> 00:21:00,800
Pakete im ersten Jahr und jetzt 
viel Spaß mit der weiteren 

462
00:21:00,800 --> 00:21:03,760
Folge. 
Ja, und dann können wir ja mal 

463
00:21:03,760 --> 00:21:05,560
gucken. 
Ich denke, dass das, was man 

464
00:21:05,560 --> 00:21:08,640
sonst noch so so kennt, ist das 
Superwised Learning, das haben 

465
00:21:08,640 --> 00:21:10,800
wir dann halt auch schnell 
verstanden, was da los ist. 

466
00:21:11,200 --> 00:21:14,880
Da ist die Idee, dass ich ne 
Vorhersage treffen möchte, ja 

467
00:21:14,880 --> 00:21:18,080
das Ziel ist ist ne Vorhersage 
zu treffen, ja und da gibt es ja

468
00:21:18,080 --> 00:21:20,880
das ganz klassische Beispiel, 
zum Beispiel sortiere halt 

469
00:21:20,880 --> 00:21:23,920
Katzen und Hunde, ja. 
Und wenn ich dann also lerne, 

470
00:21:23,920 --> 00:21:26,320
quasi, was ist ne Katze und was 
ist n Hund in einem Bild? 

471
00:21:26,320 --> 00:21:29,400
Ja und wenn ich dann ne neue n 
neues Bild hab von einer von 

472
00:21:29,400 --> 00:21:31,400
einer Katze oder einem Hund 
trifft halt ne Vorhersage ist 

473
00:21:31,400 --> 00:21:33,040
das jetzt halt ne Katze oder ist
das n Hund? 

474
00:21:33,040 --> 00:21:35,760
Ja mit diesem einfachen Ding 
also das ist n 

475
00:21:35,760 --> 00:21:39,040
Klassifizierungsproblem in der 
in der Machine Learning Lingo ja

476
00:21:39,520 --> 00:21:42,720
und das erschlägt schon wieder 
auch n riesen Katalog von von 

477
00:21:42,720 --> 00:21:45,440
Dingern ja Klassifizierung ist 
halt einfach Key ja und 

478
00:21:45,440 --> 00:21:48,400
Klassifizierung wenn ich 
Klassifizierung über Katze und 

479
00:21:48,400 --> 00:21:51,040
Hund weiter hinaus denke und 
quasi. 

480
00:21:51,440 --> 00:21:53,360
Alles Klassifiziere, was wir so 
kennen. 

481
00:21:53,360 --> 00:21:54,560
Also wie funktioniert der 
Mensch? 

482
00:21:54,560 --> 00:21:57,320
Ja, ich klassifiziere ja nicht 
nur, also ich weiß natürlich, 

483
00:21:57,320 --> 00:21:58,720
was eine Katze und Hund ist. 
Ich weiß aber auch, was ein 

484
00:21:58,720 --> 00:22:01,560
Regenwurm ist. 
Ein Blatt am Baum, was für ein 

485
00:22:01,560 --> 00:22:04,280
Käfer, welches Gesicht gehört zu
Gerrit und so weiter und sofort 

486
00:22:04,280 --> 00:22:09,040
ja und ich klassifiziere sogar 
segmentiere sogar von dem was 

487
00:22:09,040 --> 00:22:12,040
ich sehe, ah das ist eine Wand, 
das ist ein Haus, das ist ein 

488
00:22:12,040 --> 00:22:13,880
Gesicht, das ist eine Brille, 
ich habe ja 1000, 

489
00:22:13,880 --> 00:22:17,120
abstraktionslevels und so weiter
aber insgesamt ist dieses ein 

490
00:22:17,120 --> 00:22:20,320
riesiges Klassifizierungsding 
ja, das ist ein klassischer Fall

491
00:22:20,320 --> 00:22:23,040
für einen. 
Für nen Superwise Learning. 

492
00:22:23,520 --> 00:22:27,560
Die Daten sind quasi quasi die 
Bilder, ja oder 3 d Daten oder 

493
00:22:27,560 --> 00:22:30,560
wie auch immer ja die ich da 
reinstecke und gegeben diesen 

494
00:22:30,560 --> 00:22:34,880
Daten kann man zum Beispiel 
sagen OKKI lernen doch erstmal, 

495
00:22:34,880 --> 00:22:37,960
was siehst du überhaupt? 
Ja und dann kann man ja sagen, 

496
00:22:37,960 --> 00:22:40,720
OK ich sehe hier n Bild ich sehe
hier ne Lampe an der Wand ja ich

497
00:22:40,720 --> 00:22:43,360
sehe den Gerrit da sitzen 
nämlich zum Beispiel ne also das

498
00:22:43,360 --> 00:22:47,120
kann man erreichen indem man 
dein Superwise Learning macht, 

499
00:22:47,120 --> 00:22:50,320
das heißt die Daten. 
Daten, die einfach mal da sind, 

500
00:22:50,320 --> 00:22:51,920
die werden Gelabelt, das ist 
wichtig. 

501
00:22:51,920 --> 00:22:55,920
Ja, da steht halt dran, das was 
hier dieser Kopf, ja das ist 

502
00:22:55,920 --> 00:22:59,200
halt n Kopf, ja und das das 
eckige, das ist halt n Bild, ja 

503
00:22:59,200 --> 00:23:02,800
und so weiter ja und dann 
versuch ich quasi n Modell zu 

504
00:23:02,800 --> 00:23:04,560
bauen das auch am Anfang dumm 
ist. 

505
00:23:05,000 --> 00:23:07,320
Also mal so ganz platt 
gesprochen auf die Tonspur, ja 

506
00:23:07,320 --> 00:23:10,480
wie funktioniert das? 
Ich hab ein Modell in dem Falle 

507
00:23:10,480 --> 00:23:13,440
neuronales Modell ja hab ich 
meine ganzen Neuronen. 

508
00:23:13,680 --> 00:23:16,360
Die haben irgendwelche 
verteilten Gewichte, die also es

509
00:23:16,360 --> 00:23:18,440
ist quasi in dem Gehirn, was 
noch nicht funktioniert, völlig 

510
00:23:18,440 --> 00:23:21,360
dämlich. 
Ja, und dem sage ich hier hast 

511
00:23:21,360 --> 00:23:23,560
du die Daten, was denkst denn du
was das ist? 

512
00:23:23,560 --> 00:23:27,040
Ja und es wird dann irgendein 
Quatsch sagen, ja und ich weiß, 

513
00:23:27,040 --> 00:23:29,200
aber ich weiß eigentlich was es 
ist. 

514
00:23:29,200 --> 00:23:32,280
Ja ich hab die wahre Antwort 
auch da, ja und wenn ich nicht 

515
00:23:32,280 --> 00:23:35,800
die Wahrheit hab und ne 
Vorhersage von dem Modell, dann 

516
00:23:35,800 --> 00:23:39,120
kann ich n Fehler messen das das
das das entscheidende Ding ja 

517
00:23:39,520 --> 00:23:41,440
und den Fehler kann man 
skandalisieren ja. 

518
00:23:42,080 --> 00:23:44,200
Und jetzt kann ich, wenn ich n 
Fehler messen kann, zwischen der

519
00:23:44,200 --> 00:23:47,880
Vorhersage des Modells und dem 
tatsächlichen Label, dann kann 

520
00:23:47,880 --> 00:23:50,000
ich versuchen diesen Fehler zu 
minimieren. 

521
00:23:50,000 --> 00:23:52,640
Ja, und das ist das, was man 
trainieren nennt, ich Minimiere 

522
00:23:52,640 --> 00:23:57,120
diesen Fehler milliardenfach ja,
indem ich einfach immer wieder 

523
00:23:57,440 --> 00:24:00,840
immer wieder die Daten dem 
Modell zeige, immer wieder quasi

524
00:24:00,840 --> 00:24:03,520
diesen Fehler verbessere und das
tut, das tut man sehr 

525
00:24:03,520 --> 00:24:06,800
mathematisch, weil man den 
Fehler in allen Features messen 

526
00:24:06,800 --> 00:24:09,920
kann, macht man quasi ne ne ne 
ne partielle Differenzierung, 

527
00:24:10,120 --> 00:24:12,720
man misst quasi. 
Kennst du noch aus der Matte, 

528
00:24:12,800 --> 00:24:14,080
Gerrit? 
Man kann ja, man kann ja ne 

529
00:24:14,080 --> 00:24:19,360
erste Ableitung bilden, ne von 
der von der ja das ist also und 

530
00:24:19,360 --> 00:24:21,320
am Ende des Tages, also wir 
machen das mal so auf der 

531
00:24:21,320 --> 00:24:23,800
Tonspur, ja, aber am Ende des 
Tages hab ich hab ich ne 

532
00:24:23,800 --> 00:24:26,880
fehlerfunktion und ich bilde 
halt die erste Ableitung ja dann

533
00:24:26,880 --> 00:24:29,920
seh ich quasi wenn ich weit weg 
bin, dann hab ich halt ne krasse

534
00:24:29,920 --> 00:24:33,920
Steigung ja also ich die 
Ableitung zeigt mir an wie wie 

535
00:24:33,960 --> 00:24:36,280
wie krass mein Fehler gradient 
ist ja Mhm. 

536
00:24:37,400 --> 00:24:40,280
Und das tue ich halt für alle, 
für alle, für alle Parameter, 

537
00:24:40,280 --> 00:24:42,400
die ich halt optimiere. 
Und das ist im im Fall von KI 

538
00:24:42,400 --> 00:24:45,000
Hochdimensional, die wir haben 
das immer gelernt in der Schule 

539
00:24:45,000 --> 00:24:47,000
mit 2 Dimensionen haben sie ne 
Parabel, haben wir mal ne 

540
00:24:47,000 --> 00:24:50,040
Ableitung ne Analysis, ich weiß 
nicht wer das hat er jetzt auch 

541
00:24:50,040 --> 00:24:54,320
gedacht, natürlich ja so 
Klassiker ne 222 Dimensionen x 

542
00:24:54,320 --> 00:24:56,880
und Y und so, da kriegen wir es 
noch hingeschissen so im Gehirn 

543
00:24:56,960 --> 00:24:59,800
ne und die und die echte Welt 
sieht ja so aus, dass die dass 

544
00:24:59,800 --> 00:25:02,960
diese Parameter halt die 
Features im Prinzip sind, ja 

545
00:25:02,960 --> 00:25:04,560
dass sie uns noch einmal 
verstanden haben. 

546
00:25:04,960 --> 00:25:06,600
Und was sind Features, um das 
auch noch mal zu sagen? 

547
00:25:06,600 --> 00:25:09,040
Wenn wir jetzt mal bei dem Bild 
bleiben, ne erzähl ich das mal 

548
00:25:09,040 --> 00:25:10,600
kurz. 
Was ist denn denn Bild? 

549
00:25:10,600 --> 00:25:13,200
Ja n Bild besteht ja aus, also 
wenn wir jetzt hier n normales 

550
00:25:13,200 --> 00:25:16,320
quadratisches Bild haben, dann 
hab ich ja Zeilen und in jeder 

551
00:25:16,320 --> 00:25:19,080
Zeile sind halt pixelwerte drin,
das Wort Pixel hat man ja auch 

552
00:25:19,080 --> 00:25:21,720
schon mal gehört und wenn es 
jetzt nur n Graustufen wert ist,

553
00:25:21,720 --> 00:25:24,160
dann ist ja in jeder Pixelstelle
irgendwie sowas wie zwischen 0 

554
00:25:24,160 --> 00:25:27,680
und 254 ist halt n wert drin ja 
Graustufen ne und wenn ich 

555
00:25:27,680 --> 00:25:30,720
Farben hab, dann ist halt noch 
in jedem Pixel der RGB wert drin

556
00:25:30,720 --> 00:25:33,000
ne also wieviel rot, wieviel 
grün und wieviel blau ja. 

557
00:25:34,320 --> 00:25:37,680
So und jedes einzelne Pixel ist 
quasi jetzt n Feature. 

558
00:25:37,760 --> 00:25:39,640
Ja und tatsächlich wird es so 
gemacht. 

559
00:25:39,640 --> 00:25:42,480
Im Machine Learning ist das 
ganze Bild wird einfach sowieso 

560
00:25:42,480 --> 00:25:45,160
ne Spirale durchgenommen und 
quasi linearisiert in einen 

561
00:25:45,160 --> 00:25:47,840
großen Vektor wie man sagt 
tatsächlich mathematisch einen 

562
00:25:47,840 --> 00:25:49,960
Vektor. 
Ja da werden dann quasi diese 

563
00:25:49,960 --> 00:25:52,640
ganzen Dinger nacheinander 
drangehängt und dann hab ich 

564
00:25:52,640 --> 00:25:55,600
einen Vektor im n dimensionalen 
Raum der der Raum ist jetzt 

565
00:25:55,600 --> 00:25:59,840
nicht mehr 3 d oder 2 d sondern 
der ist halt so viel d wie ich 

566
00:25:59,840 --> 00:26:02,400
Pixel im Bild hab ja. 
Das heißt hab ich n fettes 

567
00:26:02,400 --> 00:26:04,520
großes Bild 4 k oder 
irgendsowas, dann hab ich n ganz

568
00:26:04,520 --> 00:26:06,760
schön hochdimensionalen Raum. 
Ja weil das der weil der Raum 

569
00:26:06,760 --> 00:26:09,200
halt so viel Dimension hat wie 
ich Pixel hab in dem Ding ja und

570
00:26:09,200 --> 00:26:12,240
wenn das dann noch RGB ist und 
dann noch mal 3 ja was ich jetzt

571
00:26:12,240 --> 00:26:14,400
machen will ist ich hab dieses 
Bild und da drin ist 

572
00:26:14,400 --> 00:26:16,680
irgendwelche Features ja in 
diesem Bild will ich erkennen da

573
00:26:16,680 --> 00:26:19,680
ist ne Lampe jetzt mal. 
Jetzt rechne ich quasi Gewichte 

574
00:26:19,680 --> 00:26:22,480
aus von meinem Modell ist jetzt 
n bisschen abstrakt ja und und 

575
00:26:22,480 --> 00:26:23,840
diese Gewichte die kann ich 
quasi. 

576
00:26:24,400 --> 00:26:26,560
Die multiplizieren quasi meinen 
Eingangsvektor. 

577
00:26:26,560 --> 00:26:30,280
Ja, und dann und dann guck ich, 
dass ich das Vorhersage, was ich

578
00:26:30,280 --> 00:26:32,680
tatsächlich als Label hab. 
Ja und das man kann sich 

579
00:26:32,680 --> 00:26:34,960
vorstellen, das wird dann halt, 
wir haben halt relativ viele 

580
00:26:34,960 --> 00:26:38,480
Vektoren, weil ich sehr viele 
Daten hab, ja weil meine Daten 

581
00:26:38,480 --> 00:26:40,960
sind ja die Bilder, ich hab ja 
Millionen von Daten, hast du 

582
00:26:40,960 --> 00:26:43,680
gesagt, das Internet ist halt 
wichtig, ich Label halt schon 

583
00:26:43,680 --> 00:26:47,360
mal ganz viele, zum Beispiel 
wenn ich ihr kennt das manchmal 

584
00:26:47,360 --> 00:26:49,440
muss man ja so. 
Wie heißt denn das bei so 

585
00:26:49,440 --> 00:26:51,520
Captures? 
Was wollte drauf drauf hinaus? 

586
00:26:51,520 --> 00:26:53,520
Du hast nämlich noch nicht 
verraten, woher kommt denn 

587
00:26:53,520 --> 00:26:55,080
eigentlich die Wahrheit? 
Ja, da können wir gleich mal 

588
00:26:55,080 --> 00:26:57,200
drüber sprechen, also zum 
Beispiel von so captures ja. 

589
00:26:57,760 --> 00:26:59,600
Ja genau, also man. 
Also es gibt natürlich die 

590
00:26:59,600 --> 00:27:02,520
Firmen selber, die jetzt KI 
Modelle trainieren, die haben 

591
00:27:02,520 --> 00:27:05,240
ganz viele Angestellte, die die 
Wahrheit produzieren, ja die die

592
00:27:05,240 --> 00:27:07,760
labeln halt selber, ja, die 
gucken sich halt mit ihrem 

593
00:27:07,760 --> 00:27:11,440
Gehirn an, was weiß ich, was zum
Beispiel alles n Auto ja in an 

594
00:27:11,440 --> 00:27:14,400
allen möglichen Szenarios wird 
verdeckt und nicht verdeckt und 

595
00:27:14,880 --> 00:27:17,200
was weiß ich ja gibt ja viele 
Autos ja. 

596
00:27:17,680 --> 00:27:19,720
Und das wird halt gelabelt. 
Ich brauch halt sehr gute Daten,

597
00:27:19,720 --> 00:27:22,800
ne so und dann und dann brauch 
ich halt diese ganzen Daten, das

598
00:27:22,800 --> 00:27:26,040
werden sehr viele sein und die 
müssen halt durch so n durch so 

599
00:27:26,040 --> 00:27:28,640
ne durch so ne superwise 
Learning durch und jedes Mal 

600
00:27:28,640 --> 00:27:30,520
versuch ich halt quasi diese 
Fehler hier n bisschen zu 

601
00:27:30,520 --> 00:27:31,880
optimieren. 
Ja wir haben ne Folge gemacht 

602
00:27:31,880 --> 00:27:33,680
aber wir es mal ganz genau 
beschrieben haben ne. 

603
00:27:34,640 --> 00:27:37,000
Der Stelle passt es, vielleicht 
würd ich echt schwer empfehlen 

604
00:27:37,000 --> 00:27:39,840
so ne aktuelle Doku von von arte
glaub ich, die heißt irgendwie 

605
00:27:39,840 --> 00:27:43,120
Madagaskar oder so. 
Die Helfer der KI, weil es gibt 

606
00:27:43,360 --> 00:27:45,040
wie diese Firmen die du gerade 
erwähnt hast. 

607
00:27:45,040 --> 00:27:48,640
Ja die gibt es, also es gibt. 
Unsereins, ja, wie wir irgendwie

608
00:27:48,800 --> 00:27:50,560
im Internet klicken und manchmal
so sagen müssen. 

609
00:27:50,560 --> 00:27:53,320
Klicke alle Motorräder an oder 
klicke auf die Bilder, wo n Bus 

610
00:27:53,320 --> 00:27:56,960
drauf ist oder so und da also so
helfen wir auch tatsächlich KI 

611
00:27:56,960 --> 00:28:00,960
zu oder Daten zu Label klicke 
auf alles was n Hydrant ist gibt

612
00:28:00,960 --> 00:28:03,920
es auch häufig so Klassiker, 
aber inzwischen ist das halt ne 

613
00:28:03,920 --> 00:28:07,360
Industrie ne da werden Menschen 
kickworker Uber will das jetzt 

614
00:28:07,360 --> 00:28:10,520
zum Beispiel auch machen, Uber 
hat jetzt angekündigt, dass die 

615
00:28:10,520 --> 00:28:14,000
Mitarbeiter die für Uber Essen 
ausfahren oder halt Leute rum 

616
00:28:14,000 --> 00:28:17,440
chauffieren. 
In den Phasen, wo sie keine 

617
00:28:17,760 --> 00:28:19,480
Fahrten machen, die ja zum 
Beispiel Daten labeln könnten 

618
00:28:19,480 --> 00:28:21,640
oder sowas. 
Ja oder es gibt auch Firmen, wie

619
00:28:21,640 --> 00:28:25,600
gesagt, die haben ganz viele 
tausende 10000 Angestellte, oft 

620
00:28:25,600 --> 00:28:28,600
in in ja Billiglohnländern 
letzten Endes im afrikanischen 

621
00:28:28,600 --> 00:28:31,720
Kontinent zum Beispiel, wo dann 
Menschen n Ganztag da sitzen und

622
00:28:31,720 --> 00:28:33,760
Sachen labeln, und da gibt es 
auch so krasse Fälle wie, ja, 

623
00:28:34,080 --> 00:28:36,320
die müssen dann zum Beispiel 3 
Wochen lang am Stück 

624
00:28:36,800 --> 00:28:40,160
Schnittwunden in Leichen labeln.
Ja, soweit kann es gehen, das 

625
00:28:40,160 --> 00:28:42,080
wird halt in dieser Doku 
dargestellt, ja damit auch ne 

626
00:28:42,080 --> 00:28:44,800
Schnittwunde in einer. 
Ne, ein Messer einstichwunde in 

627
00:28:44,800 --> 00:28:46,320
einer Leiche gehebelt werden 
kann, das muss man sich 

628
00:28:46,320 --> 00:28:47,600
vorstellen. 
Na gucken wir sich 3 Wochen 

629
00:28:47,600 --> 00:28:50,520
diese Bilder an, also krasses 
Beispiel, aber darum geht es in 

630
00:28:50,520 --> 00:28:52,160
dieser Doku, kann man sich kann 
ich sehr empfehlen. 

631
00:28:52,560 --> 00:28:55,040
Ja, genau, weil. 
Und es macht total viel Sinn, 

632
00:28:55,440 --> 00:28:58,200
weil halt tatsächlich also 
unsere Maschinenalgorithmen sind

633
00:28:58,200 --> 00:29:01,680
halt in der Lage zu lernen ne 
und so, ich nehm das echt als 

634
00:29:01,680 --> 00:29:05,200
Beispiel, ich hab selber Kinder 
die die lernen ja quasi von den 

635
00:29:05,200 --> 00:29:06,560
Eltern. 
Ja ich bin halt quasi der 

636
00:29:06,560 --> 00:29:09,520
Labeler für meine Kinder, ich 
sag denen halt, guck mal da, das

637
00:29:09,520 --> 00:29:11,280
ist halt irgendwie ne Elster 
oder irgendwie ja. 

638
00:29:11,840 --> 00:29:14,080
Und das ist halt irgendwie n 
Buntspecht oder oder was weiß 

639
00:29:14,080 --> 00:29:16,000
ich ja und die Kinder gucken 
sich ja da an und speichern sich

640
00:29:16,000 --> 00:29:17,760
ab. 
Ah, das war wohl ne Elster und 

641
00:29:17,760 --> 00:29:21,160
das war halt n Buntspecht ja und
je nachdem wie ich als wie ich 

642
00:29:21,160 --> 00:29:24,080
als Eltern quasi so drauf bin 
und was ich denen so erzähle, 

643
00:29:24,240 --> 00:29:26,280
wenn halt der wenn halt die 
Elster gar kein Elster war, 

644
00:29:26,280 --> 00:29:28,440
sondern irgendwie ne Amsel, ja 
dann speichern die Kinder das 

645
00:29:28,440 --> 00:29:31,280
trotzdem als Elster ab ja also 
wenn wenn du quasi Scheiße 

646
00:29:31,280 --> 00:29:34,240
labelst oder gar nicht labelst 
oder schlecht labelst, dann 

647
00:29:34,240 --> 00:29:36,720
kannst du halt auch nicht 
gescheit lernen ne, deswegen ist

648
00:29:36,720 --> 00:29:39,320
das so wichtig. 
Dass wir, und das Macht 

649
00:29:39,320 --> 00:29:41,640
eigentlich auch ganz, ganz viel 
Sinn, das ist ja, das ist ja die

650
00:29:41,640 --> 00:29:44,680
Logik selber, ja, wenn dein, 
wenn dein wenn dann zum Beispiel

651
00:29:44,680 --> 00:29:48,480
dein Kind irgendwie sich später 
zurechtfinden soll und und und 

652
00:29:48,480 --> 00:29:52,080
viele Sachen richtig machen 
soll, dann muss es halt gut 

653
00:29:52,080 --> 00:29:54,560
gelabelte Daten vorgesetzt 
bekommen haben. 

654
00:29:54,560 --> 00:29:56,520
Ja, das machen dann die Eltern 
am Anfang und später macht das 

655
00:29:56,520 --> 00:29:59,240
dann hoffentlich die Schule und 
so weiter ja, wo ja immer wieder

656
00:29:59,240 --> 00:30:02,240
gesagt wird, das und das ist so 
und so, ja, das ist das 

657
00:30:02,240 --> 00:30:04,720
Richtige, das ist das falsche, 
ja, so funktioniert das lernen 

658
00:30:04,720 --> 00:30:07,440
ja an sich ja, und, und das ist 
halt quasi das. 

659
00:30:07,880 --> 00:30:10,080
Das ist halt quasi das Ding was 
halt da drunter liegt. 

660
00:30:10,080 --> 00:30:12,400
Bei unseren KI Modellen. 
Ja und das ist halt auch das 

661
00:30:12,400 --> 00:30:16,280
Problem, dass wenn du schlecht 
labelst oder sagen wir mal 

662
00:30:16,280 --> 00:30:19,200
systematisch schlecht labelst 
das ist ja das was wir immer da 

663
00:30:19,200 --> 00:30:21,760
haben, wir ja das Problem mit ja
wenn wenn weil das Internet zum 

664
00:30:21,760 --> 00:30:26,480
Beispiel wenn du es einfach 
ungefiltert nimmst auch bias hat

665
00:30:26,480 --> 00:30:28,520
ja also das Internet ist ja 
eigentlich auch nichts anderes 

666
00:30:28,520 --> 00:30:32,320
als die ja die 
gesellschaftlichen Meinungen sag

667
00:30:32,320 --> 00:30:35,440
ich mal reingeblasen ungefiltert
ja mehr oder weniger ungefiltert

668
00:30:35,440 --> 00:30:37,600
ja. 
Und alles, was da an Rassismus 

669
00:30:37,600 --> 00:30:42,360
steckt oder oder an was weiß ich
ja an an Schlechtigkeiten, die 

670
00:30:42,360 --> 00:30:45,480
wird halt quasi, wenn wenn das 
als als gutes Label genommen 

671
00:30:45,480 --> 00:30:47,640
wird, halt mit trainiert. 
Ja und dann wird dein Modell 

672
00:30:47,640 --> 00:30:49,120
halt quasi genau das 
wiedergeben. 

673
00:30:49,120 --> 00:30:52,160
Ja das ist das Problem, ja, 
insofern genau ist das 

674
00:30:52,160 --> 00:30:54,080
wahrscheinlich ne coole Doku, 
ich guck mir die auch mal an, 

675
00:30:54,080 --> 00:30:57,520
finde es spannend, ja und es ist
echt Arbeit hochqualitative 

676
00:30:57,520 --> 00:30:59,520
Trainingssets zu bauen an denen 
die Modellen. 

677
00:30:59,920 --> 00:31:02,000
Gut trainiert werden können. 
Ja, wobei, das darf man jetzt 

678
00:31:02,000 --> 00:31:04,840
nicht verbinden. 
Ne, ist jetzt nicht so zwingend,

679
00:31:04,840 --> 00:31:07,520
dass die Menschen, die fürs 
Labeln bezahlt werden, klar, die

680
00:31:07,520 --> 00:31:11,040
bringen natürlich auch ihren 
Bias da mit rein, aber da geht 

681
00:31:11,040 --> 00:31:12,800
es eher drum glaub ich drum um 
das, was schon im Internet 

682
00:31:12,800 --> 00:31:14,840
vorhanden ist. 
Ne, also alles was an Texten da 

683
00:31:14,840 --> 00:31:17,480
ist und so weiter und sofort 
dort sind unsere ganzen Biases, 

684
00:31:17,480 --> 00:31:21,760
also unsere Anschauungen der 
Welt, die die vielleicht oder 

685
00:31:22,080 --> 00:31:24,640
höchstwahrscheinlich korrekt 
sind mit untergebracht, woraus 

686
00:31:24,640 --> 00:31:27,080
ja auch gelernt wird ne aus den 
Sachen die schon da sind im 

687
00:31:27,080 --> 00:31:29,840
Internet. 
Ja, ja klar, also die diese. 

688
00:31:29,840 --> 00:31:32,040
Also wenn wenn du so n großes 
Sprachmodell zum Beispiel 

689
00:31:32,040 --> 00:31:33,680
trainierst. 
Das fängt ja erstmal an, also da

690
00:31:34,000 --> 00:31:37,440
also dieses per Hand gelabelte 
im Detail richtige was du dann 

691
00:31:37,440 --> 00:31:39,240
sagst zum Beispiel Schnittwunden
und so weiter und sofort, ja, 

692
00:31:39,240 --> 00:31:42,400
das nennt man das Feintuning von
Modell ne aber aber die 

693
00:31:42,400 --> 00:31:44,640
Grobzusammenstellung. 
Erstmal die ganze Grammatik, 

694
00:31:44,640 --> 00:31:46,880
dass das die Sprachen verstehen 
kann und so weiter das wird das 

695
00:31:46,960 --> 00:31:49,240
das passiert. 
Also da sind jetzt nicht Leute 

696
00:31:49,240 --> 00:31:51,000
dahinter und sagen, wie das so 
ist, dann nimmt man einfach 

697
00:31:51,000 --> 00:31:53,120
quasi die Daten aus dem Internet
mehr oder weniger. 

698
00:31:53,200 --> 00:31:54,880
Genau, und da kommen die Biases 
rein. 

699
00:31:54,880 --> 00:31:56,800
Jetzt zum Großteil. 
Kommen da schon die Biases rein?

700
00:31:56,800 --> 00:31:57,720
Ganz genau. 
Weil es ja wieder nur 

701
00:31:57,720 --> 00:32:00,440
vorhersagt, also gerade bei 
Generativer KI Base kommt Wort 

702
00:32:00,440 --> 00:32:02,840
kommt nach dem nächsten und dann
basiert es eben auf diesen 

703
00:32:02,840 --> 00:32:04,240
Daten, ne? 
Ja. 

704
00:32:04,880 --> 00:32:08,400
OK, ja noch was zum Superwise 
Learning. 

705
00:32:08,960 --> 00:32:10,800
Ja, ich, ich, ich will 
vielleicht noch mal eine Sache 

706
00:32:10,800 --> 00:32:14,240
sagen oder wiederholen. 
Und was ich immer schwierig 

707
00:32:14,240 --> 00:32:16,400
fand, in meinem Kopf, vielleicht
bringt das auch noch mal kurz 

708
00:32:16,400 --> 00:32:19,280
auf die Tonspur. 
Also wenn, wenn wir jetzt 

709
00:32:19,280 --> 00:32:21,320
superwise Learning machen, dann 
dann gehen wir kurz noch mal die

710
00:32:21,320 --> 00:32:22,560
Schritte durch. 
Also wir haben erstmal. 

711
00:32:22,880 --> 00:32:25,000
Du wolltest ja, du wolltest ja 
auch n Beispiel machen, 

712
00:32:25,000 --> 00:32:26,800
irgendwas mit Häusern, Häusern 
und so n Haus. 

713
00:32:26,880 --> 00:32:28,720
Ja, muss ich gar nicht 
unbedingt, aber ich, ich mach es

714
00:32:28,720 --> 00:32:29,800
noch mal. 
Also wir haben, wir haben die 

715
00:32:29,800 --> 00:32:31,640
Daten zum Beispiel, dann machen 
wir das Beispiel noch mal, 

716
00:32:31,640 --> 00:32:36,800
gerade von Häusern ja, indem wir
3 Features uns angucken, ja und 

717
00:32:36,800 --> 00:32:39,120
gegeben von 3 Features wollen 
wir den Preis. 

718
00:32:39,280 --> 00:32:41,800
Lernen ja von dem Haus. 
Das wäre zum Beispiel so n 

719
00:32:41,800 --> 00:32:45,080
Minimalbeispiel, das man 
verstehen kann ja so und das 

720
00:32:45,080 --> 00:32:48,080
Modell was wir dann brauchen wir
das als zweites Mal n Modell was

721
00:32:48,080 --> 00:32:51,200
wir lernen wollen ne das ist 
dann quasi das würde dann quasi 

722
00:32:51,200 --> 00:32:55,520
sagen wenn wir jetzt 3 wir 3 
Features lernen wollen, dann 

723
00:32:55,520 --> 00:32:58,400
brauche ich also n Modell was 3 
Gewichte trainiert ja die 

724
00:32:58,400 --> 00:33:02,240
Gewichte für jedes Feature ja b 
1, b 2 und b 3 als Gewicht ja. 

725
00:33:02,800 --> 00:33:04,800
Und diese Gewichte, die würden 
quasi das Feature 

726
00:33:04,800 --> 00:33:06,120
multiplizieren, was ich gerade 
sehe. 

727
00:33:06,120 --> 00:33:08,160
Ja und dann und was immer so 
ist, dann brauch ich noch sowas 

728
00:33:08,160 --> 00:33:11,520
wie n bias ja, also wenn ich zum
Beispiel jetzt n Preis hab, wenn

729
00:33:11,520 --> 00:33:13,600
ich zum Beispiel sage meine 
Features jetzt muss ich mal kurz

730
00:33:13,600 --> 00:33:17,080
gucken, was könnten denn meine 
Features sein, zum Beispiel 

731
00:33:17,080 --> 00:33:21,800
Fläche, Zimmer und Alter vom 
Haus, ja sind die Features und 

732
00:33:21,800 --> 00:33:24,040
gegeben diesen 3 Features will 
ich quasi vorher sagen was wird 

733
00:33:24,040 --> 00:33:27,760
der Preis sein ja und dann 
brauch ich so n bias ja und der 

734
00:33:27,760 --> 00:33:30,000
Bias den kann man, das hab ich 
auch früher nicht so verstanden 

735
00:33:30,000 --> 00:33:32,640
während die. 
Gewichte quasi multiplizieren. 

736
00:33:32,640 --> 00:33:34,520
Ja, ich könnt zum Beispiel 
sagen, Fläche hab ich irgendwie 

737
00:33:34,520 --> 00:33:37,600
40 Quadratmeter ja und dann hab 
ich das Gewicht 1. 

738
00:33:37,840 --> 00:33:41,920
Dann geht das mit 40 halt quasi 
ein in die Rechnung ja einmal 40

739
00:33:41,920 --> 00:33:45,360
ja Zimmer 3 Zimmer und das 
Gewicht wär 0,1 ja würd ich 

740
00:33:45,360 --> 00:33:49,040
sagen 0,1 * 3 würde das Gewicht 
mit 0,3 eingehen ja also die 40,

741
00:33:49,040 --> 00:33:52,240
also die Gewichte werden immer 
multipliziert, ja mit dem 

742
00:33:52,240 --> 00:33:53,920
jeweiligen Feature und dann wird
zusammen. 

743
00:33:56,600 --> 00:33:59,040
Wenn ich das gemacht hab, werden
alle Gewichtungen addiert. 

744
00:33:59,040 --> 00:34:00,480
Ja dann kommt da irgendwie ne 
Zahl raus. 

745
00:34:00,480 --> 00:34:02,720
Ja sagen wir mal da kommt 
irgendwie 280 raus oder 

746
00:34:02,720 --> 00:34:07,280
irgendsowas ja das wäre dann der
Preis ja so 280 für n Haus ist. 

747
00:34:07,440 --> 00:34:10,239
Natürlich wissen wir alle 
Kilometer weit weg von dem was n

748
00:34:10,239 --> 00:34:12,920
hauswert ist normalerweise ja 
280€ jedenfalls nicht. 

749
00:34:12,920 --> 00:34:15,239
Ja da hängst du eigentlich noch 
mal 3 Nullen dran normalerweise 

750
00:34:15,239 --> 00:34:17,920
oder irgendsowas ja und hier 
kommt der Bias ins Spiel, 

751
00:34:18,159 --> 00:34:19,679
vielleicht noch mal kurz 
erklären. 

752
00:34:20,080 --> 00:34:23,040
Der Bias ist quasi die gesamte, 
also der wird quasi noch mal 

753
00:34:23,040 --> 00:34:25,040
addiert. 
Zum Schluss so n bisschen wie 

754
00:34:25,040 --> 00:34:27,040
die der Offset von dem ganzen 
Modell. 

755
00:34:27,040 --> 00:34:31,199
Ja, die Gewichte, die sollen 
quasi so n bisschen, dann sollen

756
00:34:31,199 --> 00:34:33,679
quasi die die einzelnen Features
tunen. 

757
00:34:33,800 --> 00:34:37,040
Ja und der Bias bringt das 
Modell insgesamt auf so ne 

758
00:34:37,040 --> 00:34:39,920
Grundlinie, die dann richtig 
wird für die Gesamtaussage ja, 

759
00:34:39,920 --> 00:34:43,040
also ist quasi der Y 
achsenabschnitt werden wir mal 

760
00:34:43,040 --> 00:34:46,040
reparabel bleiben ja also. 
So die Standardparabel geht halt

761
00:34:46,040 --> 00:34:49,159
durch, schneidet halt durch. 0 
ja, aber 0 ist quasi nicht der 

762
00:34:49,159 --> 00:34:51,000
Wert des Hauses, sondern 
irgendwie der ist grundsätzlich 

763
00:34:51,000 --> 00:34:54,880
schon mal bei 100000 ja, das 
heißt ich würde quasi plus zum 

764
00:34:54,880 --> 00:34:58,880
zum Schluss mach ich diese 
Rechnung Gewicht mal feature mal

765
00:34:58,880 --> 00:35:01,160
Gewicht plus feature, mal 
gewicht plus feature, mal 

766
00:35:01,160 --> 00:35:05,760
Gewicht 3 verschiedene Features 
ja ausrechnen und dann plus b 

767
00:35:06,000 --> 00:35:10,400
bias ja und dann setz ich mal 
100000 hin ja weil so der Bias 

768
00:35:10,400 --> 00:35:13,600
ist mal so Grundmäßig kostet das
immer 100000€ so n Haus ja. 

769
00:35:14,400 --> 00:35:16,880
Und der Bias ist nichts anderes 
als auch n Gewicht, was auch 

770
00:35:16,880 --> 00:35:19,600
mittrainiert wird. 
Ja, aber es hat halt n krassen 

771
00:35:19,600 --> 00:35:22,280
anderen Einfluss, weil es quasi 
die Gesamtaussage skaliert. 

772
00:35:22,280 --> 00:35:25,800
Ja so, dann hab ich also da hab 
ich die Daten und dann das 

773
00:35:25,800 --> 00:35:28,960
Modell, das Modell ist quasi im 
neuronalen Netzwerk, sind dann 

774
00:35:29,040 --> 00:35:31,040
da hab ich dann nicht nur 3 
Gewichte wie jetzt in meinem 

775
00:35:31,040 --> 00:35:33,880
Haus Fläche, Zimmer und Alter 
sondern ich hab das ist das was 

776
00:35:33,880 --> 00:35:36,840
man Parameter nennt, ich hab 
halt Milliarden ne die ich 

777
00:35:36,840 --> 00:35:39,760
irgendwie verteile die auch gar 
nicht so zugeordnet sind jetzt 

778
00:35:39,760 --> 00:35:41,320
wie ich das jetzt gemacht hab 
die werden dann einfach 

779
00:35:41,320 --> 00:35:43,120
trainiert. 
Deswegen wird es auch so. 

780
00:35:43,120 --> 00:35:44,600
Deswegen ist es so aufwendig, 
das zu machen. 

781
00:35:44,600 --> 00:35:46,880
Ja, und dann fang ich eigentlich
immer an mit einer Vorhersage, 

782
00:35:46,880 --> 00:35:49,240
ich lass jetzt das Modell ne 
Vorhersage machen, am Anfang hab

783
00:35:49,240 --> 00:35:52,080
ich quasi meine Gesicht 
Gesichte, ja meine Gewichte 

784
00:35:52,480 --> 00:35:56,120
randomisiert initiiert, ja die 
haben irgendwelche Werte völlig 

785
00:35:56,120 --> 00:35:57,400
egal. 
Ja und dann kommt auch irgendein

786
00:35:57,400 --> 00:36:01,920
Bums raus ja also zum Beispiel 
198€ oder irgendwas ja so und 

787
00:36:01,920 --> 00:36:03,760
jetzt kommt die, das hab ich 
auch gesagt, jetzt kommt der 

788
00:36:03,760 --> 00:36:05,520
Fehlercheck die loss Funktion 
ne. 

789
00:36:05,960 --> 00:36:07,760
Ich muss quasi. 
Ich rechne jetzt quasi aus. 

790
00:36:07,760 --> 00:36:11,040
Wie groß ist der Fehler zwischen
meiner, zwischen meinem Label? 

791
00:36:11,120 --> 00:36:14,280
Das Label ist für dieses Haus, 
das weiß ich quasi, das ist 

792
00:36:14,280 --> 00:36:17,040
jetzt gelabelt worden für dieses
flächezimmer Alter kenn ich den 

793
00:36:17,040 --> 00:36:21,720
Preis 198000 zum Beispiel, ja, 
also ist der Fehler 198000 - 

794
00:36:21,720 --> 00:36:25,440
198€, die ich da jetzt auch dir 
das Modell gesagt hat ja also n 

795
00:36:25,440 --> 00:36:28,960
gigantischer Fehler und jetzt 
optimier ich das ist der Motor 

796
00:36:28,960 --> 00:36:32,120
ja im Schritt im Schritt 5 
optimier ich jetzt diesen 

797
00:36:32,120 --> 00:36:34,960
Fehler, jetzt gucke ich. 
Wie muss sich jedes einzelne 

798
00:36:34,960 --> 00:36:40,080
Gewicht verändern, um den Fehler
zu verringern, den Gesamtfehler,

799
00:36:40,080 --> 00:36:43,120
um näher an die an das Label zu 
kommen, an die an die an die 

800
00:36:43,120 --> 00:36:46,160
richtige Aussage? 
Ja, und das passiert, und das 

801
00:36:46,160 --> 00:36:49,920
ist auch noch mal entscheidend, 
ich fasse jeden einzelnes 

802
00:36:49,920 --> 00:36:53,960
Gewicht an und ändere die alle 
auf einen Schlag, das ist 

803
00:36:53,960 --> 00:36:56,960
wichtig, ja, und es wird nur ein
bisschen besser werden, ich 

804
00:36:56,960 --> 00:36:58,560
komme, ich komme nicht in einem 
Sprit. 

805
00:36:58,720 --> 00:37:01,640
Zu dem richtigen Aussage, das 
ist der iterative Prozess, das 

806
00:37:01,640 --> 00:37:03,280
ist das, was man lernen quasi 
nennt. 

807
00:37:03,280 --> 00:37:07,320
Ja und wie ich dazu komme, also 
in in welche Richtung ich quasi 

808
00:37:07,320 --> 00:37:10,720
die Gewichte verändern muss 
jeweils, das ist auch wieder, 

809
00:37:10,720 --> 00:37:14,080
das ist das Optimierungsproblem,
was gelöst wird, ja, das ist das

810
00:37:14,080 --> 00:37:16,080
Wichtigste, was ich einmal sagen
wollte, weil das hatte ich immer

811
00:37:16,080 --> 00:37:18,960
oft nicht geschnallt, ist 
alleine, also das ist ja n 

812
00:37:18,960 --> 00:37:20,960
hochdimensionales 
optimierungsproblem ja an der 

813
00:37:20,960 --> 00:37:24,800
stelle, ich hab also quasi n 
Gewichte im Prinzip, und wie 

814
00:37:24,800 --> 00:37:26,640
muss ich jetzt jedes Gewicht 
verändern? 

815
00:37:27,080 --> 00:37:30,480
Damit meine mit meinen Fehler, 
den ich messen kann, ne mein 

816
00:37:30,480 --> 00:37:34,240
Fehler zwischen der Vorhersage 
und dem Wahrheit, dass der etwas

817
00:37:34,240 --> 00:37:36,440
kleiner wird. 
Ja, das ist an sich krasse 

818
00:37:36,440 --> 00:37:39,200
Wissenschaftler und da gibt es 
verschiedene Algorithmen dieses 

819
00:37:39,200 --> 00:37:41,880
Optimierungsproblem zu lösen. 
Ja und in der KI heute in den 

820
00:37:41,880 --> 00:37:43,280
neuronalen Netzen ist es gar 
nicht so. 

821
00:37:43,280 --> 00:37:45,440
N wilder Algorithmus ist der 
nennt sich Adam. 

822
00:37:45,480 --> 00:37:50,320
Ja, das ist im Prinzip ne n 
bisschen cleverer Gradient 

823
00:37:50,320 --> 00:37:52,800
Descent Algorithmus, also 
gradient Design heißt wir 

824
00:37:52,800 --> 00:37:55,280
berechnen tatsächlich die 
Steigung aus, wir differenzieren

825
00:37:55,280 --> 00:37:56,880
das ja. 
Und dann? 

826
00:37:56,880 --> 00:37:59,040
Dann gibt es auch noch so Sachen
wie Schwung, man kann sich es 

827
00:37:59,040 --> 00:38:01,480
vorstellen, es gibt geht nicht 
einfach immer nur stur dahin, 

828
00:38:01,480 --> 00:38:03,400
sondern es gibt so n paar extra 
Dinger. 

829
00:38:03,400 --> 00:38:05,440
Ja wenn ich n bisschen Schwung 
hab, man merkt sich quasi wie 

830
00:38:05,440 --> 00:38:07,200
mit wieviel Schwung bin ich in 
welche Richtung gegangen, dann 

831
00:38:07,200 --> 00:38:09,680
läuft das so n bisschen nach und
so weiter ja aber es ist es gar 

832
00:38:09,680 --> 00:38:12,360
nicht so wild. 
Ja das schicke ist ich kann das 

833
00:38:12,360 --> 00:38:15,440
ganz gut optimieren, weil ich 
quasi ne Ableitung bilden kann, 

834
00:38:15,440 --> 00:38:17,720
das passiert in neuronalen 
Wätzen ich hab manchmal andere 

835
00:38:17,720 --> 00:38:19,760
Probleme wo das 
Optimierungsproblem schon hart 

836
00:38:19,760 --> 00:38:22,400
ist. 
Ja wo wo das halt einfach nicht.

837
00:38:23,040 --> 00:38:25,840
Wo ich nicht ne ne ne ne 
partielle Ableitung bilden kann,

838
00:38:25,840 --> 00:38:28,320
weil die Funktion die darunter 
liegt nicht ableitbar ist. 

839
00:38:28,560 --> 00:38:31,120
Es gibt unstetige, wenn ich so 
diskrete Werte hab ich zum 

840
00:38:31,120 --> 00:38:33,040
Beispiel mein wenn mein mein 
Optimierungsproblem ist. 

841
00:38:33,040 --> 00:38:35,960
Ich schieß auch mit dem Bogen 
auf ne Scheibe und es gibt halt 

842
00:38:35,960 --> 00:38:39,200
Scorings fürs Bull Eye gibt es 
halt irgendwie 20 für die für 

843
00:38:39,200 --> 00:38:41,320
das hinten Quadrat gibt es 
irgendwie mal 3 Punkte oder 

844
00:38:41,320 --> 00:38:44,000
irgendsowas ja dann dann kann 
ich sogar wenn ich n bisschen 

845
00:38:44,000 --> 00:38:47,120
aus dem Bull Eye rausschieße 
oder wenn ich im Bull Eye bin 

846
00:38:47,120 --> 00:38:49,360
und schieß nur n Millimeter 
daneben hab ich immer noch 2020 

847
00:38:49,360 --> 00:38:51,600
20 und dann schieß ich da raus 
hab ich auf einmal 0 oder 

848
00:38:51,600 --> 00:38:54,560
irgendsowas ja das ist das ist 
mathematisch keine glatte 

849
00:38:54,560 --> 00:38:56,080
Funktion. 
Ja das kann ich ja nicht einfach

850
00:38:56,080 --> 00:38:58,080
ableiten, da kommt da nur 
Scheiße bei raus, da muss ich 

851
00:38:58,080 --> 00:39:00,960
anders optimieren, da gibt es 
andere Optimierungsalgorithmen 

852
00:39:00,960 --> 00:39:04,960
ja so das wie simplex Simulated 
and Neeling genetic Algorithmus 

853
00:39:04,960 --> 00:39:07,360
und so weiter und sofort ja das 
ist der Optimierer der da drin 

854
00:39:07,360 --> 00:39:10,080
steckt ist quasi wie der Motor 
an sich schon krasse 

855
00:39:10,080 --> 00:39:13,280
Wissenschaftler so aber wenn ich
den hab dann dann kommt der 

856
00:39:13,280 --> 00:39:15,560
Schritt 6 und der ist eigentlich
einfach nur die Wiederholung ist

857
00:39:15,560 --> 00:39:18,240
die Schleife ja jetzt. 
Hab ich quasi die Gewichte n 

858
00:39:18,240 --> 00:39:22,040
bisschen optimiert und jetzt geh
ich wieder zu Schritt 3 zurück 

859
00:39:22,040 --> 00:39:24,000
und Schritt 3 zurück. 
War die Vorhersage jetzt jetzt 

860
00:39:24,000 --> 00:39:27,160
geb ich quasi mit diesen neuen 
Gewichten wieder Daten rein und 

861
00:39:27,320 --> 00:39:29,920
gucke was los ist. 
Ja und dann muss ich das 

862
00:39:29,920 --> 00:39:32,560
natürlich tun, für jeden 
einzelnes Datum ja, also für 

863
00:39:32,560 --> 00:39:34,760
jedes einzelne Bild von den 
Milliarden die es im Internet 

864
00:39:34,760 --> 00:39:37,120
gibt ja so. 
Und jetzt kann man sich 

865
00:39:37,120 --> 00:39:39,320
vorstellen, warum wir da kuda 
Grafikkarten brauchen und so 

866
00:39:39,320 --> 00:39:41,080
weiter aber so funktioniert es. 
Grund der Rechenleistung soll 

867
00:39:41,080 --> 00:39:42,920
ich noch mal sagen ja, 
Rechenleistung ja genau. 

868
00:39:42,960 --> 00:39:44,560
Ja, krass, soll ich das auch 
noch nicht gesehen. 

869
00:39:44,560 --> 00:39:46,960
Es klang am Anfang, es ging so 
einfach los mit diesen diesen 3 

870
00:39:46,960 --> 00:39:49,160
Sachen, die so optimiert werden 
müssen. 

871
00:39:49,600 --> 00:39:51,680
Klingt ja gar nicht so 
kompliziert, aber ist ein. 

872
00:39:53,160 --> 00:39:55,600
Richtig also, wenn es diese 3 
Dinger sind, dann ist es einfach

873
00:39:55,600 --> 00:39:57,440
ein, da kann man es wirklich, 
wirklich cool vorstellen. 

874
00:39:57,440 --> 00:40:00,640
Du hast ne Excel Tabelle ja und 
hast du in jeder in jeder Reihe 

875
00:40:00,640 --> 00:40:03,680
hast du quasi deine 
verschiedenen Häuser und oben in

876
00:40:03,680 --> 00:40:06,080
den in den Zeilen steckt halt 
quasi Fläche Zimmer. 

877
00:40:06,400 --> 00:40:09,080
Alter und dahinter der Preis, 
das ist quasi, das ist die 

878
00:40:09,080 --> 00:40:11,120
Wahrheit. 
Ja, und jetzt lässt du das quasi

879
00:40:11,120 --> 00:40:13,520
lernen, ne, das geht schon, ne 
bist du relativ schnell fertig, 

880
00:40:13,520 --> 00:40:14,880
ja. 
Und dann hast du das aber 

881
00:40:14,880 --> 00:40:17,600
irgendwann trainiert und du hast
ja gesagt, das Ziel, das in den 

882
00:40:17,600 --> 00:40:19,400
Vorhersagen zu treffen, dann 
hast du es irgendwann trainiert 

883
00:40:19,400 --> 00:40:22,000
und den Fehler minimiert und 
dann kommst du mit irgendwelchen

884
00:40:22,160 --> 00:40:25,760
Anzahl zimmern, Quadratmetern 
und Alter und du hast dann ne 

885
00:40:25,760 --> 00:40:28,320
exakte Preisvorhersage. 
Das ist dann das fertige Modell,

886
00:40:28,320 --> 00:40:29,400
was du nutzen kannst. 
Ja, ganz. 

887
00:40:29,440 --> 00:40:31,720
Genau dann kannst du es nämlich 
auf einmal auf fremde Daten ne 

888
00:40:31,720 --> 00:40:33,840
anwenden und kannst gucken was 
los ist. 

889
00:40:34,320 --> 00:40:36,040
Und es gibt, das sag ich, 
vielleicht auch noch mal auf der

890
00:40:36,040 --> 00:40:38,800
Turnspur es gibt immer das 
Problem, dass man das, das hängt

891
00:40:38,800 --> 00:40:40,560
von vielen Sachen dann wieviel 
Parameter hast du so weiter, 

892
00:40:40,560 --> 00:40:43,920
aber es es gibt quasi wenn du 
das Modell zu hart trainierst 

893
00:40:44,080 --> 00:40:48,880
auf zu wenig Daten die zu viele 
die Hochparametrisiert wurden, 

894
00:40:48,880 --> 00:40:51,680
dann lernt es auswendig, kann 
sich auch vorstellen so n 

895
00:40:51,680 --> 00:40:54,360
bisschen ne wenn du einfach 
diese Schleife ganz oft machst 

896
00:40:54,360 --> 00:40:56,840
und dann fängt fängt es an 
auswendig zu lernen, ne und dann

897
00:40:56,840 --> 00:40:59,200
funktioniert es auch wieder 
nicht gut wenn du quasi nen ganz

898
00:40:59,200 --> 00:41:00,720
fremdes Datenstück da rein 
machst. 

899
00:41:01,200 --> 00:41:03,960
Deswegen gibt es diese, die 
sogenannte Cross Validation 

900
00:41:03,960 --> 00:41:06,920
nennt man das. 
Du kannst quasi sagen wir mal, 

901
00:41:06,920 --> 00:41:08,880
du hast jetzt irgendwie, ich 
mach mal das Beispiel einfach, 

902
00:41:08,880 --> 00:41:11,520
du hast 100 von diesen Häusern 
jetzt aufgeschrieben, du hast 

903
00:41:11,520 --> 00:41:13,520
100 Einträge deiner Excel 
Tabelle. 

904
00:41:13,520 --> 00:41:16,560
Ja und jetzt willst du quasi das
gut lernen, ja dann machst du 

905
00:41:16,560 --> 00:41:19,400
kannst du so sowas machen wie ne
ten Fold cross validation, das 

906
00:41:19,400 --> 00:41:23,120
heißt du gibst quasi nicht die 
100 Daten dem Modell mit dem 

907
00:41:23,120 --> 00:41:26,960
Label, dass sie das lernt, 
sondern du gibst immer nur 90% 

908
00:41:27,360 --> 00:41:30,400
der Daten 10% gibst du dir auf, 
ja und du machst am Anfang 

909
00:41:30,400 --> 00:41:32,800
quasi. 
Am Anfang machst du über 10 fold

910
00:41:32,800 --> 00:41:36,960
machst du dir quasi 10 Pötte, wo
jeweils andere 10% nicht zu der 

911
00:41:36,960 --> 00:41:39,080
Trainingsmenge gehören, ja, 
sondern das wird dann ne 

912
00:41:39,080 --> 00:41:42,120
überprüfungsmenge ja dann 
trainierst du quasi nur mit 90 

913
00:41:42,120 --> 00:41:46,000
von den 100 und die anderen 10, 
die nimmst du dafür zu sagen. 

914
00:41:46,000 --> 00:41:49,840
OK und jetzt gib mir mal ne 
Vorhersage ja, aber selbst für 

915
00:41:49,840 --> 00:41:52,720
das kennst du quasi auch schon 
die, die das eigentliche Label 

916
00:41:52,720 --> 00:41:56,240
ja und du kannst dir wieder ne 
Fehlerfunktion rechnen und damit

917
00:41:56,240 --> 00:41:59,520
kannst du quasi rausbekommen. 
Wie stark das Ding auswendig 

918
00:41:59,520 --> 00:42:01,240
gelernt hat? 
Oder bist du schon übertrainiert

919
00:42:01,240 --> 00:42:03,200
oder nicht? 
Ja, weil du quasi dann auch noch

920
00:42:03,200 --> 00:42:06,520
guckst. 
Du Optimierst quasi wie gut ist 

921
00:42:06,520 --> 00:42:09,000
jetzt die Voraussage für was 
eigentlich unbekannt ist. 

922
00:42:09,040 --> 00:42:10,400
Was du aber wieder messen 
kannst. 

923
00:42:10,400 --> 00:42:13,160
Ja, weil du einfach das einfach 
so heimlich weg tust. 

924
00:42:13,160 --> 00:42:15,840
Ja, das nennt man Cross 
Validation extrem wichtiger 

925
00:42:15,840 --> 00:42:17,440
Punkt, vor allen Dingen so in 
der Wissenschaft. 

926
00:42:17,440 --> 00:42:18,840
Ich komme ein bisschen aus der 
Wissenschaft und aus den 

927
00:42:18,840 --> 00:42:20,920
Sprachenmodellen musst du immer 
aufpassen, dass du nicht 

928
00:42:20,920 --> 00:42:23,160
irgendwie auswendig lernst, 
sondern dass du, dass das 

929
00:42:23,160 --> 00:42:24,840
wirklich. 
Dass die Features, die du da 

930
00:42:24,840 --> 00:42:27,880
angeblich extrahiert hast, ja, 
wie dich zum Beispiel n Protein 

931
00:42:27,880 --> 00:42:30,120
in ne Membran reinsetzt, 
vorwärts oder rückwärts oder 

932
00:42:30,120 --> 00:42:31,600
irgend so was hab ich alles 
schon mal gemacht. 

933
00:42:31,600 --> 00:42:33,600
Ja das das wird schnell 
auswendig gelernt, weil du 

934
00:42:33,600 --> 00:42:36,560
typischerweise zu wenig Daten 
hast für zu viel, zu viele 

935
00:42:36,560 --> 00:42:38,640
Freiheitsgrade, ja und dann 
lernst du das auswendig und du 

936
00:42:38,640 --> 00:42:40,080
bringst dort auch nichts. 
Ja und dann kannst du diese 

937
00:42:40,080 --> 00:42:43,440
Cross Readitations nutzen. 
Gut ich. 

938
00:42:44,720 --> 00:42:48,720
Weiß keine, ich hab keine 
weiteren Fragen dazu und dann 

939
00:42:48,720 --> 00:42:51,520
würd ich sagen haben wir das 
Superwise Learning mal. 

940
00:42:52,120 --> 00:42:55,600
Ganz gut betrachtet und dann 
abgehandelt und ne immer alles. 

941
00:42:55,600 --> 00:42:57,920
Also wir können natürlich nicht 
am allerletzten Stand der 

942
00:42:57,920 --> 00:43:00,800
Forschung hier sein, das was so 
sag sag ich mal in den Research 

943
00:43:00,800 --> 00:43:03,680
Laboren der Welt passiert, da 
arbeiten ja gerade schwer 

944
00:43:03,680 --> 00:43:06,360
überbezahlte Wissenschaftler auf
der ganzen Welt dran, irgendwie 

945
00:43:06,360 --> 00:43:08,320
so n so n Typ der jetzt für 
Meter Gang ist hat irgendwie n 

946
00:43:08,320 --> 00:43:10,800
milliardenvertrag für 34 Jahre 
oder so was unterschrieben, das 

947
00:43:10,800 --> 00:43:12,320
ist schon Wahnsinn was das 
passiert. 

948
00:43:12,640 --> 00:43:13,800
Ja, aber ich find das doch ganz 
cool. 

949
00:43:13,800 --> 00:43:15,680
Ja, ich mein Fußballer kriegen 
ja auch Millionen oder 

950
00:43:15,680 --> 00:43:18,360
Milliardenverträge. 
Milliarden noch nicht die 

951
00:43:18,360 --> 00:43:21,520
Karriere gerade tatsächlich 
besser als als Profifußballer, 

952
00:43:21,520 --> 00:43:22,280
ja. 
Vielleicht. 

953
00:43:22,280 --> 00:43:25,680
Cristiano Ronaldo kommt dran, 
aber das war es ja ja, aber es 

954
00:43:25,680 --> 00:43:28,280
ist doch auch mal ganz nett. 
Ja, normalerweise ist immer 

955
00:43:28,280 --> 00:43:30,640
umgekehrt, die, die sind sehr 
schlau und kriegen überhaupt. 

956
00:43:31,840 --> 00:43:34,000
Kein Geld, ja, und das krasse 
ist die Transfer, also die 

957
00:43:34,000 --> 00:43:38,240
Transfersummen, ja also die die 
designing Boni und und und wie 

958
00:43:38,240 --> 00:43:40,400
die da von A nach B verkauft 
werden, das ist doch genauso 

959
00:43:40,400 --> 00:43:42,160
verrückt oder fast noch 
verrückter als das was im 

960
00:43:42,160 --> 00:43:44,400
Fußball passiert, ja. 
Ja, ist doch cool. 

961
00:43:44,560 --> 00:43:46,880
Man könnte einfach gut, dass wir
so n bisschen so einer Bubbles 

962
00:43:46,880 --> 00:43:49,200
Time entgegenkommen. 
Ja das irgendwann mal Plub 

963
00:43:49,200 --> 00:43:50,720
macht, dann ist die Blase erst 
mal kaputt. 

964
00:43:50,720 --> 00:43:53,280
Schauen wir mal. 
Gut, ja, das ist keine 

965
00:43:53,280 --> 00:43:54,600
Anlageempfehlung. 
Müssen wir dazu vielleicht 

966
00:43:54,600 --> 00:43:57,920
sagen, lass uns noch über das 
Unsipulized Learning sprechen. 

967
00:43:57,920 --> 00:44:00,000
Ja, das find ich eigentlich 
total spannend und das ist mir 

968
00:44:00,000 --> 00:44:01,560
so auf den ersten Blick 
eigentlich noch gar nicht klar, 

969
00:44:01,560 --> 00:44:02,880
wie das wie das funktionieren 
kann. 

970
00:44:03,200 --> 00:44:06,720
Die Beispiele die ich hier habe 
ist zum Beispiel Clustering, 

971
00:44:06,720 --> 00:44:09,280
also wie Kunden zum Beispiel, 
die in einem Onlineshop 

972
00:44:09,280 --> 00:44:11,680
unterwegs sind, aber vielleicht 
so n Großer wie Zalando oder 

973
00:44:11,680 --> 00:44:15,440
Botti oder was auch immer Amazon
sich verhalten oder 

974
00:44:15,440 --> 00:44:19,440
Anomalieerkennung fand ich auch 
total spannend, also wie quasi 

975
00:44:19,440 --> 00:44:23,040
erkannt wird, dass jemand zum 
Beispiel deinen Paypal Account 

976
00:44:23,440 --> 00:44:26,160
benutzt in einer Art und Weise 
wie er normalerweise nicht 

977
00:44:26,160 --> 00:44:29,400
benutzt wird und du daraufhin 
automatisch ne Warnung bekommst.

978
00:44:29,400 --> 00:44:30,800
Das bekomm ich ab und zu mal 
oder was? 

979
00:44:30,880 --> 00:44:32,680
Na ja schon n bisschen länger 
her, Paypal macht das glaub ich 

980
00:44:32,680 --> 00:44:35,440
zum Beispiel, dass die sagen, 
OK, hier ist grad irgendwie n 

981
00:44:35,440 --> 00:44:37,680
auffälliger zweiten in deinem 
Account bist wirklich du das? 

982
00:44:37,680 --> 00:44:40,480
Ja und dann frag ich einfach mal
nach, was übrigens jetzt auch 

983
00:44:40,480 --> 00:44:43,440
schon wieder von irgendwie 
anderen für Spam benutzt wird 

984
00:44:43,440 --> 00:44:47,200
oder für Phishing Versuche glaub
ich so Tool als wenn Sie paypal 

985
00:44:47,200 --> 00:44:50,000
und dich warnen ja aber das ist 
ja glaub ich fake. 

986
00:44:50,480 --> 00:44:52,240
Aber gut, das ist n anderes 
Thema, aber auf jeden Fall 

987
00:44:52,240 --> 00:44:53,920
sowas. 
Also wie wie funktioniert das? 

988
00:44:53,920 --> 00:44:58,440
Ja also ich hab chaotische Daten
letzten Endes genau irgendwo da 

989
00:44:58,440 --> 00:45:00,160
drinne sind Muster und 
Strukturen und die will ich 

990
00:45:00,160 --> 00:45:02,320
wahrscheinlich erkennen. 
Ja, ja, genau ich. 

991
00:45:02,720 --> 00:45:05,440
Ich formuliere n bisschen 
mathematischer als was du sagst.

992
00:45:05,520 --> 00:45:07,840
Ja bitte, wenn du, wenn du 
chaotische Daten hast und 

993
00:45:07,840 --> 00:45:10,840
irgendwo da drin sind Muster und
Strukturen, ja ich dann sagt der

994
00:45:10,840 --> 00:45:14,800
Mathematiker OK du hast höhere 
Dimensionen als die Daten 

995
00:45:14,800 --> 00:45:18,240
tatsächlich irgendwie abliefern.
Ja du hast Artifiziell die die 

996
00:45:18,240 --> 00:45:20,080
die Dimension zu hoch getrieben,
ja. 

997
00:45:20,640 --> 00:45:24,560
Weil wahrscheinlich kannst du 
irgendwie je nachdem ja kannst 

998
00:45:24,560 --> 00:45:27,560
du irgendwie ne ganze Menge 
davon weglassen und die 

999
00:45:27,560 --> 00:45:30,080
Wahrheit, die Muster da drinne 
sind halt eigentlich viel 

1000
00:45:30,080 --> 00:45:32,040
niedriger Dimensional als die 
Daten da sind. 

1001
00:45:32,040 --> 00:45:33,840
Jetzt kannst du rauschen und das
andere Gedöns ist nicht so 

1002
00:45:33,840 --> 00:45:36,880
wichtig ja aber den Punkt den 
ich machen will ist im Prinzip 

1003
00:45:36,880 --> 00:45:39,520
ist Unsupervised Learning und du
hast die beiden Beispiele 

1004
00:45:39,520 --> 00:45:41,640
gemacht, es ist halt einfach ne 
ganz andere Anwendungsfall du 

1005
00:45:41,640 --> 00:45:43,680
kannst jetzt nicht hier sagen 
ich mach jetzt LLMS mit 

1006
00:45:43,680 --> 00:45:46,400
Unsupervised Learning hat es 
funktioniert einfach von der von

1007
00:45:46,400 --> 00:45:48,520
der von der ganzen Logik her 
nicht von der Sprache her nicht,

1008
00:45:48,520 --> 00:45:50,400
ja. 
Du willst halt quasi selbständig

1009
00:45:50,400 --> 00:45:53,240
irgendwelche Features erkennen, 
die in einer Horde chaotischer 

1010
00:45:53,240 --> 00:45:55,200
Daten drin sind. 
Ja, da gibt es auch wieder ne 

1011
00:45:55,200 --> 00:45:57,440
ganze Schar von Algorithmen, die
man da drauf anwenden kann. 

1012
00:45:57,440 --> 00:46:00,960
Im Prinzip suchst du raus, was 
sind die höchsten Varianten 

1013
00:46:01,440 --> 00:46:04,080
innerhalb meines Datensets und 
was sind auch die höchsten Co 

1014
00:46:04,080 --> 00:46:06,880
Varianten, das heißt welche 
Features und die hab ich jetzt 

1015
00:46:06,880 --> 00:46:09,120
noch nicht gesagt, quasi die 
muss ich quasi selber finden. 

1016
00:46:09,120 --> 00:46:11,520
Ja ich ich pack da halt quasi 
auch im Prinzip was ich mache 

1017
00:46:11,520 --> 00:46:14,000
ist trotzdem so chaotische Daten
und ich packe quasi die ganzen 

1018
00:46:14,000 --> 00:46:16,320
Datenpunkte. 
Wieder in den Vektor rein? 

1019
00:46:16,320 --> 00:46:18,200
Ja, das muss man vielleicht 
einmal verstanden haben, so seh 

1020
00:46:18,200 --> 00:46:20,240
ich da immer die Welt. 
Ja, für mich ist das für mich 

1021
00:46:20,240 --> 00:46:23,320
ist n Vektor, das kann man sich 
in Zweidimensionen feststellen, 

1022
00:46:23,320 --> 00:46:26,400
ne in Vektor ist ja quasi sind 
ja ist ja nen Zahlenstring ja 

1023
00:46:26,400 --> 00:46:28,760
stellen wir 0 und 1 drin zum 
Beispiel dann zeigt er halt 

1024
00:46:28,760 --> 00:46:31,680
quasi im Zweidimensionalen 
irgendwo hin ja n Vektor hat ja 

1025
00:46:31,680 --> 00:46:34,800
quasi n Anfang und so ne Spitze 
ja im Dreidimensionalen, dann 

1026
00:46:34,800 --> 00:46:36,800
kann ich quasi den schon in so 
einer wenn ich den an der Kugel 

1027
00:46:36,800 --> 00:46:39,200
festmache, dann kann er ja quasi
auf auf der ganzen Einheitskugel

1028
00:46:39,200 --> 00:46:42,160
irgendwo hinzeigen ja. 
So, und und die die Inhalte des 

1029
00:46:42,160 --> 00:46:44,080
Vektors, die bestimmen ja seine 
Richtung, wo er irgendwie 

1030
00:46:44,080 --> 00:46:45,960
hinguckt. 
Ja, und die Inhalte des Vektors 

1031
00:46:45,960 --> 00:46:48,320
sind halt die Features. 
Ja, wenn ich jetzt chaotische 

1032
00:46:48,320 --> 00:46:51,080
Daten hab, dann wenn ich 
chaotische Bilddaten hab, dann 

1033
00:46:51,080 --> 00:46:53,920
nennen das halt quasi wären das 
halt vektoren, wie gesagt im 

1034
00:46:53,920 --> 00:46:56,760
Bilddimensionsraum, aber die 
zeigen ja trotzdem irgendwo hin 

1035
00:46:56,760 --> 00:46:59,520
ne und was ich jetzt machen 
will, ich guck mir in diesem 

1036
00:46:59,520 --> 00:47:03,120
Ende mit so einem Vektorraum 
quasi was für Wolken bilden sich

1037
00:47:03,120 --> 00:47:05,640
da so ja welche gehören 
irgendwie wohl zusammen, ja und 

1038
00:47:05,640 --> 00:47:08,320
welche nicht und auch wenn ich 
die dann quasi Gewichte, ja. 

1039
00:47:08,720 --> 00:47:11,000
Das ist relativ komplex, das 
ganze getönt so, ja, aber das 

1040
00:47:11,000 --> 00:47:13,440
ist halt dieses Clustering. 
Die Daten werden quasi 

1041
00:47:13,440 --> 00:47:16,080
geclustert und strukturiert und 
das da gibt es auch nicht nur 

1042
00:47:16,080 --> 00:47:19,880
eine Ansicht, ich projiziere 
quasi wichtige Eigenschaften und

1043
00:47:19,880 --> 00:47:22,400
die lerne ich quasi vom Projekt,
weil man kann quasi lernen. 

1044
00:47:22,400 --> 00:47:26,400
OK, wenn ich diesen an dieser 
einen Stelle zum Beispiel an der

1045
00:47:26,400 --> 00:47:29,040
Stelle 15 oder irgendsowas, ja, 
da da, da scheint irgendwas 

1046
00:47:29,040 --> 00:47:31,720
zusammenzuhängen bei bestimmten 
von diesen Vektoren, ja wenn 

1047
00:47:31,720 --> 00:47:34,640
ich, wenn ich das irgendwie nach
oben drehe, dann bewegen die 

1048
00:47:34,640 --> 00:47:36,000
sich alle gleichmäßig irgendwo 
hin. 

1049
00:47:36,000 --> 00:47:38,400
Ja, so grob kann man es sich 
vorstellen, ja. 

1050
00:47:38,720 --> 00:47:40,800
Wenn ich irgendwas gleich weiß 
ich mit, dann ist das ne Co 

1051
00:47:40,800 --> 00:47:43,760
Varianz zum Beispiel ja und wenn
es nen starken Einfluss hat auf 

1052
00:47:43,760 --> 00:47:47,120
die auf die auf die neue 
Krümmung von diesem Vektor, dann

1053
00:47:47,120 --> 00:47:50,640
ist es auch n starkes Feature. 
Ja, ich entdecke quasi starke 

1054
00:47:50,640 --> 00:47:53,360
Features die stark miteinander 
korrelieren und so weiter und 

1055
00:47:53,360 --> 00:47:56,720
dann splitte ich quasi die 
Dimension und sage OK, das sind 

1056
00:47:56,720 --> 00:47:59,080
die wichtigen und jetzt meine 
Dimensionsreduzierung da gibt es

1057
00:47:59,080 --> 00:48:01,920
auch ganz viele Algorithm PCA ja
Principle Component Analyst ist,

1058
00:48:01,920 --> 00:48:04,120
das heißt Principle, also was 
sind die prinzipiellen 

1059
00:48:04,120 --> 00:48:06,400
Komponenten, was sind die? 
Krassen Features ja, und dann 

1060
00:48:06,400 --> 00:48:09,280
kann ich das runter projizieren 
in niedriger dimensionalen Raum.

1061
00:48:09,360 --> 00:48:12,480
Oft wird es sogar tatsächlich in
3 d oder 2 d runter projiziert 

1062
00:48:12,800 --> 00:48:14,600
und dann kann ich mir nämlich 
das kennst du gerät, dann kann 

1063
00:48:14,600 --> 00:48:16,920
ich mir als Mensch das 
vorstellen und das angucken und 

1064
00:48:16,920 --> 00:48:20,080
sehe zum Beispiel aus einer 
Horde von Bildern, ah guck mal, 

1065
00:48:20,080 --> 00:48:22,720
die haben diesen dieses Feature 
ja die Clustern so und so, ja 

1066
00:48:22,720 --> 00:48:24,800
und dann kann ich ja auch 
mehrere Projektionen machen, ich

1067
00:48:24,800 --> 00:48:27,360
kann, ich muss ja nicht ne wenn 
ich jetzt viele Features da drin

1068
00:48:27,360 --> 00:48:29,840
hab, dann mach ich halt viele 
Ansichten von der von dem 

1069
00:48:29,840 --> 00:48:32,240
gleichen Problem, aber ich 
cluster mir das quasi 

1070
00:48:32,240 --> 00:48:35,040
verschiedene Dinger. 
Also das ist alles das Thema 

1071
00:48:35,040 --> 00:48:38,000
Unsupervised Learning. 
Ja, es hat damit zu tun, wie 

1072
00:48:38,000 --> 00:48:41,440
kann ich allein gegeben den 
Daten mit mathematischen 

1073
00:48:41,440 --> 00:48:46,080
Modellen rausfinden, was sind 
hier relevante Features die die 

1074
00:48:46,080 --> 00:48:47,720
irgendwelche Zusammenhänge 
zeigen. 

1075
00:48:47,720 --> 00:48:50,080
Ja ich würd es mal ich man muss 
es fast so grob irgendwie hin 

1076
00:48:50,080 --> 00:48:52,520
formulieren, ja weil so oder so 
ähnlich funktioniert es ja, dann

1077
00:48:52,520 --> 00:48:54,760
gibt es halt lineare Methoden, 
nichtlineare und so weiter die 

1078
00:48:54,760 --> 00:48:57,120
Mathematik. 
Geht da wieder Case und die die.

1079
00:48:57,840 --> 00:49:00,560
Und die Anomalie erkennst du 
dann deshalb, weil du halt deine

1080
00:49:00,560 --> 00:49:02,920
Klasse hast und so, und das ist 
du kannst, also du hast ganz 

1081
00:49:02,920 --> 00:49:05,680
viele Datensätze, die die passen
dann zu den anderen irgendwie 

1082
00:49:05,680 --> 00:49:07,720
und dann plötzlich hast du 
einen, der passt nicht mehr zu 

1083
00:49:07,720 --> 00:49:10,160
den anderen und das ist 
auffällig das da, da lohnt es 

1084
00:49:10,160 --> 00:49:12,840
sich dann reinzugucken quasi. 
Ja, das da hab ich zum Beispiel 

1085
00:49:12,840 --> 00:49:14,000
dann den Tod. 
Tatsächlich hab ich darüber 

1086
00:49:14,000 --> 00:49:16,600
promoviert oder sowas, ich hab 
also anderen, das kannst du 

1087
00:49:16,600 --> 00:49:18,520
nämlich cool, das kann man sich 
auch wieder mit diesem 

1088
00:49:18,520 --> 00:49:21,000
Vektorraum vorstellen. 
Ja ich hab zum Beispiel, ich 

1089
00:49:21,000 --> 00:49:24,400
hatte ganz viele Bilder ja in in
meiner Promotion, das war n. 2. 

1090
00:49:24,400 --> 00:49:26,440
Das waren halt quasi 
Durchprojektionen von von 

1091
00:49:26,440 --> 00:49:27,760
Molekülen. 
Ist aber auch egal, total 

1092
00:49:27,760 --> 00:49:31,200
verrauscht, ja und ich musste 
quasi von einer Millionen 

1093
00:49:31,200 --> 00:49:33,400
kleiner Bilder, die so viel 
Briefmarken waren, auf denen wir

1094
00:49:33,400 --> 00:49:35,840
fast nichts sehen konnten, weil 
es nur rauschen war, musste ich 

1095
00:49:35,840 --> 00:49:39,280
quasi die Zusammensummieren um 
das Signal im Rauschen zu 

1096
00:49:39,280 --> 00:49:42,000
verstärken, die aber 
zusammengehören. 

1097
00:49:42,000 --> 00:49:44,720
Ja was ich gemacht hab ist genau
das, ich hab quasi jedes Bild in

1098
00:49:44,720 --> 00:49:47,160
den Vektor genommen, ja und dann
hab ich erstmal in diesem 

1099
00:49:47,160 --> 00:49:49,000
Vektorraum, da hab ich noch n 
bisschen Krams und so weiter 

1100
00:49:49,000 --> 00:49:51,480
gemacht, aber im Prinzip kannst 
du dann du kannst ja auch im 

1101
00:49:51,480 --> 00:49:54,520
Hochdimensionalen. 
Raum Abstände berechnen, das ist

1102
00:49:54,520 --> 00:49:57,560
ja Algebra. 
Ja, du kannst also ganz klar, 

1103
00:49:57,560 --> 00:50:00,000
man kann sich es vorstellen, ist
der Abstand zwischen 2 Vektoren 

1104
00:50:00,000 --> 00:50:03,160
im 2 d Raum ne zwischen den 
Spitzen ne, das funktioniert 

1105
00:50:03,160 --> 00:50:05,360
aber im internationalen Raum 
genauso, das heißt man kann sich

1106
00:50:05,360 --> 00:50:07,120
so vorstellen wenn du ich ich 
sehe das immer sowieso 

1107
00:50:07,120 --> 00:50:10,440
blumensträuße ja also jedes 
einzelne Datensatz ist quasi so 

1108
00:50:10,440 --> 00:50:13,640
n so n Stängel von der Blume ja 
und n paar Blumen die die die 

1109
00:50:13,640 --> 00:50:16,080
hängen irgendwie zusammen so ja 
und jetzt hast du auf einmal ne 

1110
00:50:16,080 --> 00:50:19,320
Blume die die guckt in ne ganz 
andere Richtung ja das ist der 

1111
00:50:19,320 --> 00:50:21,360
Outleiher das ist dann ne 
Anomalie detection ja. 

1112
00:50:21,960 --> 00:50:23,680
Und wenn du erst mal weißt, 
welche Blumen, wenn du die 

1113
00:50:23,680 --> 00:50:25,600
Geclustert hast, die Blumen, die
Zusammenhängen, die haben 

1114
00:50:25,600 --> 00:50:27,800
irgendwie was zusammen zu tun 
und der eine guckt weg, ja dann 

1115
00:50:27,800 --> 00:50:31,280
hat er halt ne große Varianz. 
Ja in diesem Datensatz ja die 

1116
00:50:31,280 --> 00:50:33,720
Varianz zwischen den Dingen, das
ist die ganze Statistik, ja wenn

1117
00:50:33,720 --> 00:50:35,880
du was irgendwie zusammenhängen 
kannst in den Minen ausrechnen 

1118
00:50:35,880 --> 00:50:37,840
statt ne ne Varianz und so 
weiter und so das wird auch 

1119
00:50:37,840 --> 00:50:40,880
gemacht ja sind halt einfach 
statistische Kenngrößen im 

1120
00:50:40,880 --> 00:50:43,080
andimensionalen Raum. 
Ja und dann kannst du auch 

1121
00:50:43,080 --> 00:50:46,240
outlire Detections machen, ne. 
Audiokommentar Burkhard 

1122
00:50:46,240 --> 00:50:49,280
gestikuliert wild mit den Händen
rum und versucht, Blut daraus zu

1123
00:50:49,280 --> 00:50:54,000
Zeugen, wo eine, wo eine Stange 
wegknickt, könnt ihr nicht 

1124
00:50:54,000 --> 00:50:56,080
sehen, aber dadurch ist mir das 
jetzt auch n bisschen klarer 

1125
00:50:56,080 --> 00:51:00,080
geworden, was er gerade erzählt 
hat und den Abstand dazwischen. 

1126
00:51:00,560 --> 00:51:01,600
Ja genau. 
Genau. 

1127
00:51:01,600 --> 00:51:03,040
Also so, so kann man sich es 
grob vorstellen. 

1128
00:51:03,040 --> 00:51:05,560
Genau, und das Outlayer ist 
genau das sind dann einfach, ja 

1129
00:51:05,560 --> 00:51:08,040
man hat halt Features entdeckt 
und innerhalb dieser Features 

1130
00:51:08,040 --> 00:51:10,240
Sets fallen halt n Paar raus die
halt ganz anders sind an der 

1131
00:51:10,240 --> 00:51:12,160
Stelle ja und dann kann man so 
was alles machen, ja. 

1132
00:51:12,400 --> 00:51:15,520
Am Ende ist viel Mathe viel, 
viel Optimierungsalgorithmik, 

1133
00:51:15,520 --> 00:51:18,480
aber das geht schon. 
Ne, klingt ganz so, wollen wir 

1134
00:51:18,480 --> 00:51:20,840
dann an Supervised Learning auch
beenden. 

1135
00:51:20,840 --> 00:51:23,600
Ja cool, danke gibt es. 
Gibt es noch irgendeinen 

1136
00:51:23,760 --> 00:51:26,040
anderen, ne andere Art von 
Waschenellem lernen lernen oder 

1137
00:51:26,040 --> 00:51:26,800
so? 
Die werde ich hier noch 

1138
00:51:26,800 --> 00:51:28,280
erwähnen. 
Sollten die ich jetzt gar nicht 

1139
00:51:28,280 --> 00:51:30,080
auf dem Zettel hatte oder was du
benutzt. 

1140
00:51:30,160 --> 00:51:31,840
Ich glaub die ich glaub die 
Kategorisierung ist schon 

1141
00:51:31,840 --> 00:51:33,920
richtig. 
Ne Supervised an Supervised und 

1142
00:51:33,920 --> 00:51:37,280
wie Enforcement 1 oben drauf. 
So, dann haben die halt ihre 

1143
00:51:37,280 --> 00:51:39,600
Algorithmen, die hatten wir ja 
angedeutet beim Supervised dann 

1144
00:51:39,600 --> 00:51:42,400
wie es funktioniert und dann 
haben wir immer das innere 

1145
00:51:42,400 --> 00:51:45,120
Liegende dann matruschka, wenn 
ich die Puppe noch mal nehmen 

1146
00:51:45,120 --> 00:51:46,760
darf, dann haben wir ein 
innerliegenderes Problem, das 

1147
00:51:46,760 --> 00:51:49,920
ist n optimierungsproblem, wo 
wir halt quasi die Gewichte, 

1148
00:51:49,920 --> 00:51:53,760
oder man sagt Parameter das 
Analogiewort optimieren müssen, 

1149
00:51:53,760 --> 00:51:57,200
sodass halt ne, das ist quasi 
das eindimensionale Problem, die

1150
00:51:57,200 --> 00:51:59,600
Gewichte müssen halt so 
optimiert werden, dass zusammen 

1151
00:52:00,160 --> 00:52:04,000
neu die neue Gewichtsverteilung 
den Fehler zu meiner Aussage 

1152
00:52:04,000 --> 00:52:06,040
etwas minimiert. 
Da haben wir es glaub ich 

1153
00:52:06,040 --> 00:52:07,920
eigentlich alles. 
Ja von der Grobkategorisierung 

1154
00:52:07,920 --> 00:52:10,920
und quasi innerhalb dieser 
Kategorisierung gibt es dann 

1155
00:52:10,920 --> 00:52:13,840
halt den ganzen Blumenstrauß an 
algorithmiken methodiken, 

1156
00:52:13,840 --> 00:52:16,360
Modellen, mit denen ich das 
irgendwie machen kann. 

1157
00:52:16,360 --> 00:52:20,080
Ne stellt sich heraus, dass halt
das Modell der neuronalen Netze 

1158
00:52:20,320 --> 00:52:24,680
mit dem Optimierer Adam, also 
dem quasi dem partiellen 

1159
00:52:24,680 --> 00:52:27,360
differenzieren auf Vektoren und 
Tensoren und so weiter, dass 

1160
00:52:27,360 --> 00:52:31,680
dass das sowohl berechenbar wird
und auch die besten Ergebnisse 

1161
00:52:31,680 --> 00:52:34,000
liefert, da das ist das was ne 
so moderne KI ist, ja. 

1162
00:52:34,400 --> 00:52:38,360
Sehr vereinfacht gesagt, ja, ja.
Ja, ist ja auch ein Podcast. 

1163
00:52:38,360 --> 00:52:41,040
Ne ich seh keinen, keine 
Wissenschaftsvorlesung cool, 

1164
00:52:41,120 --> 00:52:44,800
dann lass uns nicht noch länger 
ziehen als muss ja ich glaub das

1165
00:52:44,800 --> 00:52:48,360
war gut so bisschen die 
Geschichte, bisschen die 

1166
00:52:48,360 --> 00:52:51,680
Einordnung und mal grob die die 
Algorithmen angesprochen oder 

1167
00:52:51,680 --> 00:52:52,960
die Arten des maschinellen 
Lernens. 

1168
00:52:52,960 --> 00:52:55,200
Ich hoffe ihr konntet ein 
bisschen was mitnehmen, wie 

1169
00:52:55,200 --> 00:52:57,160
gesagt, ich kann noch mal, ich 
werde diese Dokus da bei Arte 

1170
00:52:57,160 --> 00:53:00,400
empfehlen, die haben mehrere 
coole Dokus zu KI und ansonsten 

1171
00:53:00,720 --> 00:53:02,880
hören wir uns in 2 Wochen oder 
Burkhard würdest du noch 

1172
00:53:02,880 --> 00:53:03,440
irgendwas? 
Sagen. 

1173
00:53:03,520 --> 00:53:05,920
Nö, lass mal, lass mal gut sein.
Ne, ist alles gut. 

1174
00:53:05,920 --> 00:53:07,840
Ja ich ich finde immer die 
Optimierer so spannend, da könnt

1175
00:53:07,840 --> 00:53:09,680
ich jetzt noch n bisschen was 
erzählen, aber ich denke es ist 

1176
00:53:09,680 --> 00:53:11,480
genug ja also man passt schon 
ne. 

1177
00:53:11,480 --> 00:53:14,240
Vielleicht machen wir irgendwann
noch mal ne andere Podcast Folge

1178
00:53:14,240 --> 00:53:16,640
oder wenn ihr zufällig einen KI 
Wissenschaftler deutschsprachig 

1179
00:53:16,640 --> 00:53:19,960
kennt, der Bock hat mal mit zu 
diskutieren in unserem Podcast, 

1180
00:53:19,960 --> 00:53:24,320
dann macht gerne Intro perfekt. 
Dankeschön euch fürs Zuhören bis

1181
00:53:24,320 --> 00:53:26,880
in 2 Wochen und haltet ihr euch 
steif tschau tschau. 

1182
00:53:27,520 --> 00:53:31,280
Bis denne tschüsschen. 
Einfach komplex wird produziert 

1183
00:53:31,280 --> 00:53:34,720
und präsentiert von Heisenware. 
Heisenware ist deine Low Code 

1184
00:53:34,720 --> 00:53:38,240
Plattform zur Erstellung und zum
Betrieb interaktiver Apps rund 

1185
00:53:38,240 --> 00:53:40,240
um den Shopfloor. 
Starte noch heute dein Free 

1186
00:53:40,240 --> 00:53:44,000
Trial unterheisenware.com 
einfach komplex.

