Deep Learning und neuronale Netze

Um das Deep Learning genauer erklären zu können, muss zuerst auf neuronale Netze eingegangen werden. 

 Zur Erklärung: Ein neuronales Netz besteht aus künstlichen Neuronen, die durch Algorithmen die Nervenzellen eines Gehirns nachahmen sollen. 

Wie künstliche Neuronen bzw. so ein neuronales Netz arbeitet, ist sehr komplex und mathematisch, weswegen auf eine detaillierte Erklärung hier verzichtet wird. Wichtig zu wissen ist jedoch, dass es durch solche neuronalen Netze möglich ist, aus sehr großen Datenmengen schnell zu lernen, weshalb es auch in den letzten Jahren zu einem solchen Hype rund um die KI gekommen ist, da nun genügend Rechenleistung für solche Modelle vorhanden war (Wittpahl, 2019). 

Zwei bekannte Modelle für neuronale Netze: 

  • LLM (Large-Language-Models: große, vortrainierte Sprachmodelle, wie zum Beispiel ChatGPT) (Minaee et al., 2024)
  • GANs (Generative Adversarial Networks) - ein wichtiges Modell für Deepfakes (Wittpahl, 2019)

Beim Deep Learning, als das tiefergehende Lernen, kommen mehrere Schichten eines neuronalen Netzes zum Einsatz (Tufféry, 2023).

Beispiele für Deep Learning sind die natürliche Sprachverarbeitung (zum Beispiel bei ChatGPT oder bei Sprachassistenten) oder die verbesserte Leistung bei der Bilderkennung


Quellen:

Minaee, S., Mikolov, T., Nikzad, N., Chenaghlu, M., Socher, R., Amatriain, X., & Gao, J. (2024). Large Language Models: A Survey(Version 3). arXiv. https://doi.org/10.48550/ARXIV.2402.06196

Tufféry, S. (2023). Deep learning: From big data to artificial intelligence with R. Wiley. https://doi.org/10.1002/9781119845041

Wittpahl, V. (Hrsg.). (2019). Künstliche Intelligenz: Technologie | Anwendung | Gesellschaft. Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-662-58042-4