Skip to main content

Schätzer für Zustandsbewertung und Aktionsauswahl

  • Chapter
  • First Online:
Reinforcement Learning
  • 260 Accesses

Zusammenfassung

In der Regel reichen die verfügbaren Ressourcen nicht aus, um Steuerung, Bewertungsfunktion oder Modell tabellarisch zu erfassen. Daher werden in diesem Kapitel parametrisierte Schätzer eingeführt, mit denen wir die Bewertung von Zuständen oder probabilistische Aktionspräferenzen abschätzen können, selbst dann, wenn sie nicht in genau gleicher Form zuvor beobachtet worden sind.

„Ebenso wie Federn irrelevant für das Fliegen sind, werden wir im Laufe der Zeit möglicherweise entdecken, dass Neuronen und Synapsen für die Intelligenz unbedeutend sind.“ (Alpaydin 2019). (Ethem Alpaydin)

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

eBook
USD 24.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 34.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Auch „efferente Nervenzellen“ oder „Motoneuronen“

  2. 2.

    Autor: Zoran Sevarac; Copyright 2010 Neuroph Project http://neuroph.sourceforge.net. Licensed under the Apache License, Version 2.0 (the „License“); http://www.apache.org/licenses/LICENSE-2.0. Weitere Hinweise sind in den Files des zitierten Programmcodes.

  3. 3.

    Autor: Zoran Sevarac; Copyright 2010 Neuroph Project http://neuroph.sourceforge.net. Licensed under the Apache License, Version 2.0 (the „License“); http://www.apache.org/licenses/LICENSE-2.0; Weitere Hinweise sind in den Files des zitierten Programmcodes.

  4. 4.

    S. Kakade and J. Langford. „Approximately optimal approximate reinforcement learning“. In: ICML. Bd. 2. 2002, S. 267–274.

Literatur

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Uwe Lorenz .

5.1 Elektronisches Zusatzmaterial

Rights and permissions

Reprints and permissions

Copyright information

© 2024 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Lorenz, U. (2024). Schätzer für Zustandsbewertung und Aktionsauswahl. In: Reinforcement Learning. Springer Vieweg, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-68311-8_5

Download citation

  • DOI: https://doi.org/10.1007/978-3-662-68311-8_5

  • Published:

  • Publisher Name: Springer Vieweg, Berlin, Heidelberg

  • Print ISBN: 978-3-662-68310-1

  • Online ISBN: 978-3-662-68311-8

  • eBook Packages: Computer Science and Engineering (German Language)

Publish with us

Policies and ethics