Zusammenfassung
Eine Vielzahl der aktuell digital verfügbaren Haushaltspläne ist in unstrukturierten Formaten eingebettet und daher nicht unmittelbar durch Rechner interpretierbar. Aus diesem Grund gewinnen Methoden der Informationsextraktion zunehmend an Bedeutung. Unser Ansatz kombiniert optische Zeichenerkennung mit „Natural Language Processing“ basierend auf maschinellen Lernmethoden zur Identifizierung von gesuchten Inhalten. Mithilfe einer regelbasierten Python-Applikation werden Informationen extrahiert und anschließend auf „Google Maps“ visualisiert. Zunächst beschreiben wir die Vorgehensweise zur Erstellung des Datenkorpus. Ein trainiertes „Machine-Learning Natural-Language-Modell“ (AutoML = Automated Machine Learning) wird eingesetzt. Eine Python-Anwendung verbindet alle für die Prozessierung relevanten Schritte. Unsere Methode bietet eine Effizienzsteigerung bei der Extraktion und Analyse von Haushaltsplänen.
This is a preview of subscription content, access via your institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsLiteratur
Adobe Inc. (2006). PDF (Portable Document Format), version 1.7, Base level (ISO 32000-1:2008). https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdf_reference_archive/pdf_reference_1-7.pdf. Zugegriffen: 2. Sept. 2019.
Alonso Bel, N. H. M, & Pedersen, B. S. (2011). Identification of sense selection in regular polysemy using shallow features. In: Proceedings 18th Nordic Conference on Computational Linguistics NODALIDA 2011 May 11–13, 2011, Riga Latv 18–25.
Alpaydin, E. (2010). Introduction to machine learning (2. Aufl.). Cambridge: MIT Press.
Ashrafian, H. (2014). Artificial Intelligence and Robot Responsibilities: Innovating Beyond Rights. Science and Engineering Ethics, 21, 317–326. https://doi.org/10.1007/s11948-014-9541-0.
Bates, M. (1995). Models of natural language understanding. Proceedings of the National Academy of Sciences of the United States of America, 92, 9977–9982.
Borkowski, A. A., Wilson, C. P., Borkowski, S. A., et al. (2019). Google Auto ML versus Apple Create ML for Histopathologic Cancer Diagnosis; Which Algorithms Are Better? Pathology and Laboratory Medicine Services, 18.
Chen, D., Müller, H.-M., & Sternberg, P. (2006). Automatic document classification of biological literature. BMC Bioinformatics, 7, 370. https://doi.org/10.1186/1471-2105-7-370.
Coldewey, D., & Lardinois, F. (2017). DeepL schools other online translators with clever machine learning. https://techcrunch.com/2017/08/29/deepl-schools-other-online-translators-with-clever-machine-learning/. Zugegriffen: 3. Sept. 2019.
Gack, P., & Rudel, G. (Hrsg.). (2013). Kommunale Politik gestalten: Grundlagen, Rahmenbedingungen, Handlungsmöglichkeiten: Kommunalpolitische Schriftenreihe; 12. Bamberg: Petra-Kelly-Stiftung.
GADM. (Hrsg.). (2013). GADM. https://gadm.org/download_country_v3.html. Zugegriffen: 5. Sept. 2019.
Gandomi, A., & Haider, M. (2015). Beyond the hype: Big data concepts, methods, and analytics. International Journal of Information Management, 35, 137–144. https://doi.org/10.1016/j.ijinfomgt.2014.10.007.
Google Cloud. (2019). AutoML Natural Language Beginner’s guide. In: cloud.google.com. https://cloud.google.com/natural-language/automl/docs/beginners-guide. Zugegriffen: 10. Nov. 2019.
Google. (2019a). Cloud AutoML: Train high-quality custom machine learning models with minimal effort and machine learning expertise. https://cloud.google.com/automl/. Zugegriffen: 10. Nov. 2019.
Google. (2019b). Natural language: Derive insights from unstructured text using google machine learning. https://cloud.google.com/natural-language/. Zugegriffen: 10. Nov. 2019.
Google. (2019c). AI and machine learning products: Innovative machine learning products and services on a trusted platform. https://cloud.google.com/products/ai/ Y3 – 2019, 03. September M4 – Citavi.
Haykin, S. (2008). Neural networks and learning machines (3. Aufl.). New York: Pearson.
Kashif Imran. (2019). Automatically extract text and structured data from documents with Amazon Textract. https://aws.amazon.com/de/blogs/machine-learning/automatically-extract-text-and-structured-data-from-documents-with-amazon-textract/. Zugegriffen: 10. Nov. 2019.
Landeshauptstadt Düsseldorf. (2019). Open Data Düsseldorf. https://opendata.duesseldorf.de/. Zugegriffen: 10. Nov. 2019.
Leviathan, Y., & Matias, Y. (2018). Google duplex: An AI system for accomplishing real-world tasks over the phone. https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html. Zugegriffen: 8. Sept. 2019.
Li, Z., Guo, H., Wang, W. M., et al. (2019). A blockchain and automl approach for open and automated customer service. IEEE Transactions on Industrial Informatics, 15, 3642–3651. https://doi.org/10.1109/tii.2019.2900987.
Mahabal, A., Baldridge, J., Karagol Ayan, B., et al. (2019). Text classification with few examples using controlled generalization. In: Proceedings of the 2019 Conference of the North. Association for Computational Linguistics, Stroudsburg, PA, USA, (S. 3158–3167).
McCarthy, J., Minsky, M. L., Rochester, N., & Shannon, C. E. (2006). A proposal for the dartmouth summer research project on artificial intelligence. AI Magazine, 27, 12–14.
McCrae, J. P. (2016). Putting ontologies to work in NLP: The lemon model and its future.
Minsky, M. (1961). Steps toward artificial intelligence. Proceedings of the IEEE, 49(1), 8–30.
NDSA Standards and Practices Working Group. (2014). The Benefits and Risks of the Pdf/A-3 File Format for Archival Institutions : an NDSA report. 1–24.
Open Knowledge Foundation. (2019a). OParl 1.1 Spezifikation. https://oparl.org/spezifikation/. Zugegriffen: 10. Nov. 2019.
Open Knowledge Foundation. (Hrsg.). (2019b). Open Knowledge Foundation. https://okfn.de/. Zugegriffen: 3. Sept. 2019.
Osner, A. (Hrsg.). (2004). Ratsinformationssysteme erfolgreich einführen: Ein Leitfaden für Politik und Verwaltung. Gütersloh: Verl. Bertelsmann-Stiftung.
Russell, S. J., & Norvig, P. (2016). Artificial intelligence (3. Aufl.). Boston: Pearson.
Sarle, W. S. (2019). Newsgroup artificial neural networks. ftp://ftp.sas.com/pub/neural/FAQ.html. Zugegriffen: 3. Sept. 2019.
Schindler, T. (2016). Seminar KI: gestern, heute, morgen: Natural Language Processing and Machine Learning.
Schmidhuber, J. (2015). Deep learning in neural networks: An overview. Neural Networks, 61, 85–117. https://doi.org/10.1016/j.neunet.2014.09.003M4-Citavi.
Schmidhuber, J. (2017). Künstliche Intelligenz wird alles ändern. Handelsblatt 1–6.
Schwabe, G. (2003). Ratsinformationssysteme. https://www.zora.uzh.ch/id/eprint/57176/1/20120125142146_merlin-id_3157.pdf. Zugegriffen: 3. Sept. 2019.
Senatsverwaltung für Stadtentwicklung und Wohnen. (2017). Big Data und Crowd Data für die Berliner Stadtentwicklungsplanung. Berlin: Senatsverwaltung für Stadtentwicklung und Wohnen.
Treffpunkt Kommune. (2017). Kommunen zeigen sich online von der besten Seite – Treffpunkt Kommune. https://www.treffpunkt-kommune.de/kommunen-zeigen-sich-online-von-der-besten-seite/. Zugegriffen: 3. Sept. 2019.
Truong, A., Walters, A., Goodsitt, J., et al. (2019). Towards Automated Machine Learning: Evaluation and Comparison of AutoML Approaches and Tools. 9.
Vickrey, D., Biewald, L., Teyssier, M., & Koller, D. (2005). Word-sense disambiguation for machine translation. HLT/EMNLP 2005 – Hum Lang Technol Conf Conf Empir Methods Nat Lang Process Proc Conf (S. 771–778).
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2020 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Braka, D., Buchkremer, R., Ebener, S. (2020). Informationsextraktion und kartografische Visualisierung von Haushaltsplänen mit AutoML-Methoden. In: Buchkremer, R., Heupel, T., Koch, O. (eds) Künstliche Intelligenz in Wirtschaft & Gesellschaft. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-29550-9_7
Download citation
DOI: https://doi.org/10.1007/978-3-658-29550-9_7
Published:
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-29549-3
Online ISBN: 978-3-658-29550-9
eBook Packages: Business and Economics (German Language)