Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.
Dieses Buch soll aus dir einen besseren Python-Programmierer machen. Um den größten Nutzen aus diesem Buch zu ziehen, solltest du bereits über Python-Kenntnisse verfügen, die du erweitern möchtest. Am besten ist es, wenn du schon eine Weile in Python programmierst und bereit bist, in die Tiefe zu gehen, deine Kenntnisse abzurunden und deinen Code pythonischer zu machen. Wenn du dich fragst, welche weniger bekannten Teile in Python du kennen solltest, gibt dir dieses Buch eine Roadmap an die Hand. Entdecke coole und gleichzeitig praktische Python-Tricks, mit denen du beim nächsten Code Review der Hit bist. Wenn du Erfahrung mit älteren Versionen von Python hast, wird dich das Buch mit modernen Mustern und Funktionen vertraut machen, die in Python 3 eingeführt wurden. Dieses Buch ist aber auch hervorragend für dich geeignet, wenn du schon Erfahrungen mit anderen Programmiersprachen hast und dich schnell in Python einarbeiten möchtest. Du wirst hier einen wahren Schatz an praktischen Tipps und Entwurfsmustern finden, die dir helfen, ein erfolgreicher Python-Programmierer zu werden.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 282
Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:
Zu diesem Buch – sowie zu vielen weiteren dpunkt.büchern – können Sie auch das entsprechende E-Book im PDF-Format herunterladen. Werden Sie dazu einfach Mitglied bei dpunkt.plus+:
www.dpunkt.plus
Dan Bader
Praktische Tipps für Fortgeschrittene
Dan Bader
Lektorat: Melanie Feldmann
Übersetzung: G&U Language & Publishing Services GmbH, Flensburg (www.GundU.com)
Copy-Editing: Sandra Gottmann, Münster-Nienberge
Satz: G&U Language & Publishing Services GmbH, Flensburg (www.GundU.com)
Herstellung: Stefanie Weidner
Umschlaggestaltung: Helmut Kraus, www.exclam.de
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
ISBN:
Print 978-3-86490-568-1
PDF 978-3-96088-599-3
ePub 978-3-96088-600-6
mobi 978-3-96088-601-3
1. Auflage 2018
Copyright © 2018 dpunkt.verlag GmbH
Wieblinger Weg 17
69123 Heidelberg
Copyright © 2017 by Dan Bader
Title of the English original: Python Tricks: A Buffet of Awesome Python Features ISBN 978-1775093305
Translation Copyright © 2018 by dpunkt.verlag GmbH. All rights reserved.
Die vorliegende Publikation ist urheberrechtlich geschützt. Alle Rechte vorbehalten. Die Verwendung der Texte und Abbildungen, auch auszugsweise, ist ohne die schriftliche Zustimmung des Verlags urheberrechtswidrig und daher strafbar. Dies gilt insbesondere für die Vervielfältigung, Übersetzung oder die Verwendung in elektronischen Systemen.
Es wird darauf hingewiesen, dass die im Buch verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken- oder patentrechtlichem Schutz unterliegen.
Alle Angaben und Programme in diesem Buch wurden mit größter Sorgfalt kontrolliert. Weder Autor noch Verlag können jedoch für Schäden haftbar gemacht werden, die in Zusammenhang mit der Verwendung dieses Buches stehen.
5 4 3 2 1 0
Danksagung
Vorwort
1Einführung
1.1Was sind Python-Tricks?
1.2Der Zweck dieses Buches
1.3Wie du dieses Buch lesen solltest
2Muster für saubereres Python
2.1Sich mit Zusicherungen absichern
2.2Kommasetzung
2.3Kontextmanager und die Anweisung with
2.4Einfache und doppelte Unterstriche
2.5Die furchtbare Wahrheit über Stringformatierung
2.6Das Easter Egg »The Zen of Python«
3Effektive Funktionen
3.1Pythons Funktionen sind erstklassig
3.2Lambda-Funktionen
3.3Dekoratoren sind mächtig
3.4Spaß mit *args und **kwargs
3.5Funktionsargumente auspacken
3.6Hier gibt es nichts zurück
4Klassen und objektorientierte Programmierung
4.2Stringkonvertierung
4.3Eigene Ausnahmeklassen definieren
4.4Objekte klonen
4.5Abstrakte Basisklassen
4.6Benannte Tupel
4.7Klassen- und Instanzvariablen
4.8Instanz-, Klassen- und statische Methoden
5Gebräuchliche Datenstrukturen in Python
5.1Dictionarys
5.2Arrays
5.3Datensätze, Strukturen und DTOs
5.4Mengen und Multimengen
5.5Stacks (LIFO)
5.6Queues (FIFO)
5.7Prioritätsqueues
6Schleifen und Iterationen
6.1Pythongerechte Schleifen schreiben
6.2Listennotation
6.3Slicing-Tricks mit dem Sushi-Operator
6.4Die Schönheit von Iteratoren
6.5Generatoren: vereinfachte Iteratoren
6.6Generatorausdrücke
6.7Iterator-Ketten
7Tricks mit Dictionarys
7.1Standardwerte für Dictionarys
7.2Dictionarys sortieren
7.3switch/case-Anweisungen mit Dictionarys emulieren
7.4Der verrückteste Dictionary-Ausdruck der Welt
7.5Möglichkeiten zum Zusammenführen von Dictionarys
7.6Übersichtliche Dictionary-Ausgabe
8Techniken zur Produktivitätssteigerung
8.1Python-Module und -Objekte
8.2Projektabhängigkeiten mit virtuellen Umgebungen isolieren
8.3Ein Blick hinter den Bytecode-Vorhang
9Abschließende Gedanken
9.1Der kostenlose Tipp der Woche für Python-Entwickler
9.2PythonistaCafe: Eine Gemeinschaft von Python-Entwicklern
Stichwortverzeichnis
Vielen herzlichen Dank an die Betaleser der deutschen Übersetzung:
Jürgen Gmach
Marc Richter
Jan Wagner
Oliver Kraitschy
Alexander Junge
Pascal Bawidamann
Peer Wagner
Euer Feedback war super hilfreich!
Es ist fast zehn Jahre her, seit ich meine erste Begegnung mit Python als Programmiersprache hatte. Python lernte ich zunächst nur widerwillig. Ich hatte bereits in verschiedenen anderen Sprachen programmiert, als ich bei der Arbeit plötzlich einem anderen Team zugeteilt wurde, dessen Mitglieder allesamt Python verwendeten. Das war der Anfang meiner eigenen Erfahrungen mit Python.
Bei meiner Einführung in Python hatte man mir gesagt, dass es leicht sei und dass ich es sehr schnell begreifen würde. Als ich meine Kollegen um Lernmaterial bat, gaben sie mir lediglich einen Link zur offiziellen Python-Dokumentation. Die Lektüre dieser Dokumentation war zu Anfang ziemlich verwirrend, und ich brauchte einige Zeit, bevor ich mich auch nur in der Dokumentation zurechtfand. Sehr oft musste ich auf Stack Overflow nach Antworten suchen.
Da ich schon Erfahrungen mit anderen Programmiersprachen hatte, brauchte ich keine Einführung in die Programmierung und auch keine Erklärungen, was Klassen und Objekte sind. Ich suchte nach Quellen, die konkret die Merkmale von Python beschrieben, die Besonderheiten aufzeigten und mir sagten, wie sich das Programmieren in Python vom Programmieren in anderen Sprachen unterscheidet.
Es hat viele Jahre gedauert, Python richtig schätzen zu lernen. Als ich Dans Buch las, wünschte ich mir, ich hätte es schon zur Hand gehabt, als ich vor vielen Jahren Python lernte.
Um ein Beispiel zu geben: Eines der vielen besonderen Python-Merkmale, die mich zu Anfang überraschten, war die Listennotation. Wie Dan in diesem Buch erwähnt, ist die Gestaltung von for-Schleifen etwas, woran man jemanden erkennen kann, der von einer anderen Programmiersprache zu Python gewechselt ist. Ich weiß noch, dass einer der ersten Kommentare, die ich zu Anfang meiner Python-Zeit bei einem Code Review erhielt, lautete: »Warum verwendest du hier keine Listennotation?« Dan erklärt diese Vorgehensweise sehr gut in Kapitel 6, wobei er damit beginnt, wie Schleifen auf pythonische Weise geschrieben werden, und sich dann zu Iteratoren und Generatoren vorarbeitet.
In Kapitel 2.5 erklärt Dan die verschiedenen Möglichkeiten zur Stringformatierung in Python. Die Stringformatierung ist eines der Dinge, die dem Zen of Python widersprechen, laut dem es nur eine offensichtliche Möglichkeit geben soll, etwas zu tun. Dan führt die verschiedenen Möglichkeiten auf, darunter auch meine Lieblingsergänzung der Sprache, nämlich F-Strings, und nennt dabei auch die Vor- und Nachteile der einzelnen Methoden.
Das Kapitel über Techniken zur Produktivitätssteigerung ist eine weitere hervorragende Quelle. Sie deckt Aspekte ab, die über die Programmiersprache Python hinausgehen, und gibt Tipps für das Debugging und die Verwaltung von Abhängigkeiten. Außerdem erhältst du hier einen kleinen Einblick in Python-Bytecode.
Es ist mir wirklich eine Ehre und eine Freude, die Einführung zu diesem Buch von meinem Freund Dan Bader schreiben zu dürfen.
Durch meine Beiträge zu Python als CPython-Hauptentwicklerin habe ich Verbindungen zu vielen Mitgliedern der Community. Auf meinem Weg mit Python habe ich Mentoren, Verbündete und viele neue Freunde gefunden. Sie machen mir klar, dass es bei Python nicht nur um den Code geht: Python ist eine Gemeinschaft.
Die Programmierung mit Python zu meistern, bedeutet nicht nur, die theoretischen Aspekte der Sprache zu verstehen. Genauso wichtig ist es auch, die Konventionen und empfohlenen Vorgehensweisen, die von der Community genutzt werden, zu verstehen und zu übernehmen.
Dans Buch hilft dir dabei. Ich bin überzeugt, dass du nach dieser Lektüre Python-Programme mit viel mehr Selbstvertrauen schreiben wirst.
– Mariatta Wijaya, Python-Core-Entwicklerin (mariatta.ca)
Python-Trick: Ein kurzes Python-Codefragment, das als Lernmittel gedacht ist. Ein Python-Trick dient entweder zur einfachen Veranschaulichung eines Aspekts von Python oder als motivierendes Beispiel, um es Dir zu ermöglichen, tiefer zu schürfen und ein intuitives Verständnis zu entwickeln.
Der Ausgangspunkt dieses Buches war eine kurze Reihe von Codeausschnitten, die ich eine Woche lang auf Twitter veröffentlicht hatte. Zu meiner Überraschung ernteten sie begeisterte Rückmeldungen und wurden noch tagelang weitergegeben.
Immer mehr Entwickler fragten mich, wo sie »die komplette Reihe« bekommen könnten. In Wirklichkeit hatte ich einfach nur einige wenige Tricks zu verschiedenen Python-Themen zusammengestellt. Dahinter steckte kein umfassendes Konzept; es war einfach nur ein kleines Twitter-Experiment.
Diese Anfragen machten mir jedoch klar, dass es sich lohnen würde auszuprobieren, meine kurzen Codebeispiele als Lernmittel zu verwenden. So stellte ich eine Reihe weiterer Python-Tricks zusammen und veröffentlichte sie in Form einer Serie von E-Mails. Nach nur wenigen Tagen hatten sich mehrere Hundert Python-Entwickler dafür registriert. Von dieser Reaktion war ich schier überwältigt.
In den folgenden Tagen und Wochen erhielt ich einen nicht enden wollenden Zustrom an Rückmeldungen von Python-Entwicklern. Sie dankten mir dafür, dass ich ihnen Aha-Erlebnisse über Aspekte der Sprache bescherte, mit deren Verständnis sie zu kämpfen hatten. Es war großartig, diese Kommentare zu hören. Während ich die Python-Tricks lediglich für Codeausschnitte gehalten hatte, zogen viele Entwickler großen Nutzen daraus.
Zu diesem Zeitpunkt entschied ich, mein Python-Tricks-Experiment zu forcieren und es zu einer Serie von ca. 30 E-Mails auszubauen. Jede dieser Mails bestand nur aus einer Überschrift und einem Screenshot mit einem Codeausschnitt, aber schon bald erkannte ich die Einschränkungen, die dieses Format mit sich brachte. In einer E-Mail brachte ein blinder Python-Entwickler seine Enttäuschung darüber zum Ausdruck, dass die Python-Tricks als Bilder geliefert wurden, sodass er sie mit seinem Screenreader nicht lesen konnte.
Um mein Projekt ansprechender zu gestalten und einem größeren Publikum zugänglich zu machen, musste ich also mehr Zeit darin investieren. Also setzte ich mich hin und schrieb die ganze Serie von Python-Tricks-E-Mails in Textformat mit übersichtlicher Syntaxhervorhebung in HTML um. Diese neue Inkarnation der Python-Tricks lief eine Weile sehr gut. Laut den Rückmeldungen, die ich bekam, waren die Entwickler froh darüber, dass sie die Codebeispiele nun einfach kopieren konnten, um selbst damit herumzuspielen.
Als sich immer mehr Entwickler für diese E-Mail-Serie registrierten, begann ich in den Kommentaren und Fragen, die mir geschickt wurden, ein Muster zu erkennen. Einige Tricks funktionierten als motivierende Beispiele sehr gut für sich allein. Bei den komplizierteren Beispielen fehlte jedoch eine erklärende Stimme, um die Leser anzuleiten oder sie auf weitere Quellen hinzuweisen, sodass sie ein tieferes Verständnis gewinnen konnten.
Dies war ein weiterer Bereich, in dem Verbesserungen notwendig waren. Der Leitspruch von dbader.org lautet: »Python-Entwicklern helfen, noch großartiger zu werden.« Hier bot sich mir offensichtlich eine Gelegenheit, um diesem Motto gerecht zu werden.
Ich entschied mich, auf der Grundlage der besten und wertvollsten Python-Tricks meines E-Mail-Kurses ein neuartiges Python-Buch zu schreiben:
Ein Buch, das die faszinierendsten Aspekte der Sprache anhand von kurzen und leicht verständlichen Beispielen erklärt
Ein Buch, das eine Reihe großartiger Python-Merkmale aufzeigt und die Motivation der Leser stets auf hohem Niveau hält
Ein Buch, das dich an die Hand nimmt und anleitet, um dir zu helfen, dein Verständnis von Python zu vertiefen
Dieses Buch war mir eine Herzensangelegenheit und auch ein enormes Experiment. Ich hoffe, dass du bei der Lektüre viel Freude hast und etwas über Python lernst.
– Dan Bader
Dieses Buch soll aus dir einen besseren – einen erfolgreicheren und kenntnisreicheren – Python-Programmierer machen. Vielleicht fragst du dich, wie es dir dabei helfen kann. Es handelt sich eben nicht um ein Python-Tutorial oder einen Einsteigerkurs. Wenn du Python erst lernst, wird dieses Buch dich nicht zu einem professionellen Python-Entwickler machen. Die Lektüre wird zwar auch dann von Vorteil für dich sein, aber du musst dir auch noch anderes Material anschauen, um grundlegende Python-Kenntnisse zu entwickeln.
Um den größten Nutzen aus diesem Buch zu ziehen, solltest du bereits über Python-Kenntnisse verfügen, die du erweitern möchtest. Am besten ist es, wenn du schon eine Weile in Python programmierst und bereit bist, in die Tiefe zu gehen, deine Kenntnisse abzurunden und deinen Code »pythonischer« zu machen.
Dieses Buch ist auch hervorragend für dich geeignet, wenn du schon Erfahrungen mit anderen Programmiersprachen hast und dich schnell in Python einarbeiten möchtest. Du wirst hier einen wahren Schatz an praktischen Tipps und Entwurfsmustern finden, die dir helfen, ein erfolgreicherer und qualifizierterer Python-Programmierer zu werden.
Die beste Möglichkeit, dieses Buch zu lesen, besteht darin, sich ihm wie einem Büffet zu nähern. Jeder Python-Trick steht für sich selbst, weshalb du einfach zu denen springen kannst, die dich am meisten interessieren. Das ist die Vorgehensweise, die ich empfehle. Du kannst natürlich auch alle Python-Tricks in der Reihenfolge lesen, in der sie im Buch erscheinen. Dadurch verpasst du nichts. Wenn du auf der letzten Seite angekommen bist, kannst du sicher sein, dass du alle gesehen hast.
Einige der Tricks sind unmittelbar verständlich, weshalb du sie problemlos in deine tägliche Arbeit übernehmen kannst, nachdem du einfach das entsprechende Kapitel gelesen hast. Bei anderen Tricks ist etwas mehr Zeit für das Verständnis vonnöten. Solltest du Schwierigkeiten damit haben, einen bestimmten Trick in deinen eigenen Programmen anzuwenden, ist es oft hilfreich, die entsprechenden Codebeispiele im Python-Interpreter durchzuspielen. Wenn es dann immer noch nicht klick macht, wende dich getrost an mich, sodass ich dir helfen und die Erklärungen verbessern kann. Langfristig nützt das nicht nur dir, sondern allen Pythonistas, die das Buch lesen.
Manchmal erhalten wirklich hilfreiche Merkmale einer Sprache nicht die Aufmerksamkeit, die sie verdienen. Aus irgendeinem Grund hat dies auch die Python-Anweisung assert getroffen.
In diesem Abschnitt gebe ich dir eine Einführung in die Verwendung von Zusicherungen (Assertions) in Python. Du erfährst hier, wie du damit Fehler in deinen Python-Programmen automatisch erkennen lassen kannst. Dadurch werden deine Programme zuverlässiger und lassen sich leichter debuggen.
Wahrscheinlich fragst du dich jetzt: »Was sind Zusicherungen, und wozu dienen sie?« Die Antworten darauf wollen wir uns in diesem Abschnitt ansehen. Im Grunde genommen handelt es sich bei der Python-Anweisung assert um eine Debugginghilfe, die eine Bedingung überprüft. Wenn diese Bedingung wahr ist, wird das Programm ganz normal weiter ausgeführt. Ist sie aber falsch, wird die Ausnahme AssertionError mit einer optionalen Fehlermeldung ausgeworfen.
Das folgende einfache Beispiel zeigt, in welchen Fällen Zusicherungen praktisch sind. Zur Veranschaulichung habe ich ein möglichst praxisnahes Problem ausgewählt, wie es in deinen Programmen tatsächlich auftreten kann.
Nehmen wir an, du schreibst einen Onlineshop in Python. Dazu fügst du dem System die folgende Funktion apply_discount für die Einlösung eines Rabattcoupons hinzu:
Die assert-Anweisung garantiert, dass die von dieser Funktion berechneten rabattierten Preise niemals kleiner als 0 € und niemals höher als der reguläre Produktpreis sein können.
Um zu prüfen, ob das wirklich wie vorgesehen funktioniert, rufen wir diese Funktion auf, um einen gültigen Rabatt abzuziehen. In unserem Beispiel stellen wir die Produkte des Shops durch einfache Dictionarys dar. In der Praxis wird das wahrscheinlich nicht funktionieren, aber zur Veranschaulichung von Zusicherungen ist es gut geeignet. Als Beispielprodukt erstellen wir ein Paar schicker Schuhe für 149,00 €:
Um Rundungsprobleme zu vermeiden, habe ich den Preis in einem Integer in Cent angegeben, was ganz allgemein eine sinnvolle Vorgehensweise ist. Aber ich schweife ab. Wenn wir auf diese Schuhe einen Rabatt von 25 % gewähren, sollten wir einen Verkaufspreis von 111,75 € erhalten:
>>> apply_discount(shoes, 0.25)
11175
Das funktioniert wie erwartet. Versuchen wir nun aber, einen ungültigen Rabatt anzuwenden, z. B. einen von 200 %, bei dem wir den Kunden für den Kauf der Schuhe noch bezahlen müssten:
>>> apply_discount(shoes, 2.0)
Traceback (most recent call last):
File "<input>", line 1, in<module>
apply_discount(prod, 2.0)
File "<input>", line 4, in apply_discount
assert0<= price <= product['price']
AssertionError
Jetzt hält das Programm mit einem Zusicherungsfehler (AssertionError) an, da ein Rabatt von 200 % die zugesicherte Bedingung in der Funktion apply_discount verletzt.
Die Ablaufverfolgung der Ausnahme zeigt an, welche Codezeile die verletzte Zusicherung enthält. Wenn du oder andere Entwickler in deinem Team beim Testen des Onlineshops auf einen solchen Fehler stoßen, kannst du anhand der Ablaufverfolgung leicht herausfinden, was geschehen ist. Das beschleunigt das Debugging erheblich und macht deine Programme langfristig wartungsfreundlicher. Das ist der große Nutzen von Zusicherungen.
Vielleicht fragst du dich, warum ich in dem vorstehenden Beispiel nicht einfach eine if-Anweisung und eine Ausnahme verwendet habe. Zusicherungen dienen dazu, Entwickler über nicht behebbare Fehler in einem Programm zu informieren, aber nicht dazu, zu erwartende Fehlerbedingungen zu signalisieren – etwa eine nicht gefundene Datei –, bei denen die Benutzer Abhilfemaßnahmen ergreifen oder einen erneuten Versuch unternehmen können.
Bei Zusicherungen handelt es sich um interne Selbsttests in einem Programm. Sie deklarieren bestimmte Bedingungen als unmöglich. Tritt eine solche Bedingung trotzdem ein, so bedeutet das, dass sich in dem Programm ein Bug befindet.
Ist das Programm fehlerfrei, kommt diese Bedingung niemals vor. Wenn sie aber doch auftritt, hält das Programm mit dem Zusicherungsfehler an, der dir mitteilt, welche unmögliche Bedingung den Absturz ausgelöst hat. Das macht es viel einfacher, Bugs zu finden und zu korrigieren. Und mir ist alles willkommen, was die Arbeit erleichtert. Dir nicht auch?
Merk dir, dass es sich bei der Python-Anweisung assert um eine Debugginghilfe handelt und nicht um einen Mechanismus für das Handhaben von Laufzeitfehlern. Zusicherungen sollen Entwicklern helfen, die Ursache eines Bugs schneller zu finden. Zusicherungsfehler sollten nur dann ausgelöst werden, wenn es in deinem Programm einen Bug gibt.
Im Folgenden wollen wir uns noch einige weitere Dinge ansehen, die wir mit Zusicherungen anstellen können, sowie zwei häufige Stolpersteine in der praktischen Anwendung.
Es ist immer sinnvoll, sich die Implementierung eines Merkmals in Python anzusehen, bevor du sie nutzt. Schauen wir uns also kurz die Syntax der Anweisung assert laut Python-Dokumentation1 an:
assert_stmt ::"assert" expression1 ["," expression2]
Hier ist expression1 die Bedingung, die geprüft wird, und der optionale Ausdruck expression2 die Fehlermeldung, die angezeigt werden soll, wenn die Zusicherung nicht erfüllt ist. Zur Ausführungszeit wandelt der Python-Interpreter jede assert-Zuweisung ungefähr in die folgende Abfolge von Anweisungen um:
if __debug__:
if not expression1:
raiseAssertionError(expression2)
Hier fallen zwei Dinge auf: Vor der Prüfung der zugesicherten Bedingung erfolgt schon eine Überprüfung der globalen Variablen __debug__. Dabei handelt es sich um ein integriertes boolesches Flag, das unter normalen Umständen True ist, bei der Anforderung von Optimierungen aber False. Mehr darüber erfährst du im Abschnitt »Stolpersteine« auf S. 8. Zudem kannst du mit expression2 eine optionale Fehlermeldung übergeben, die zusammen mit AssertionError in der Ablaufverfolgung angezeigt wird, um das Debugging noch weiter zu vereinfachen. Beispielsweise habe ich schon Code wie den folgenden gesehen:
>>>if cond 'x':
... do_x()
... elif cond 'y':
... do_y()
... else:
... assert False, (
... 'This should never happen, but it does '
... 'occasionally. We are currently trying to '
... 'figure out why. Email dbader if you '
... 'encounter this in the wild. Thanks!')
Der Code ist zwar ziemlich hässlich, aber trotzdem handelt es sich hierbei um eine sinnvolle und hilfreiche Technik, um einen Heisenbug2 in deinen Anwendungen aufzuspüren.
Bevor wir weitermachen, muss ich noch zwei Warnungen im Zusammenhang mit Zusicherungen in Python aussprechen. Die erste hat mit Sicherheitsrisiken und Bugs in deinen Anwendungen zu tun, die zweite mit einer syntaktischen Eigenheit, die es einfach macht, nutzlose Zusicherungen zu schreiben.
Zusicherungen können mit den Befehlszeilenschaltern -0 und -00 und in Python auch mit der Umgebungsvariablen PYTHONOPTIMIZE global deaktiviert3 werden. Dadurch wird jede assert-Zuweisung zu einer Nulloperation: Sie wird nicht kompiliert und auch nicht ausgewertet, und damit wird auch der Ausdruck der Bedingung nicht ausgeführt. Das ist eine Designentscheidung, die auch bei vielen anderen Programmiersprachen getroffen wurde. Als Nebenwirkung wird es dadurch sehr gefährlich, assert-Zuweisungen als schnelle und einfache Möglichkeit zur Validierung von Eingangsdaten einzusetzen.
Wenn du in einem Programm Zusicherungen einsetzt, um zu prüfen, ob ein Funktionsargument einen falschen oder unerwarteten Wert enthält, kann das nach hinten losgehen und zu Bugs und Sicherheitslücken führen. Sehen wir uns zur Veranschaulichung ein einfaches Beispiel an: Der Code deiner Onlineshop-Anwendung enthält eine Funktion, um auf Anforderung eines Benutzers ein Produkt zu löschen. Nachdem du Zusicherungen gerade kennengelernt hast, bist du nun vielleicht begierig, sie in deinem Code anzuwenden. Mir ginge es auf jeden Fall so! Deshalb implementierst du die Funktion vielleicht wie folgt:
def delete_product(prod_id, user):
assert user.is_admin(), 'Must be admin'
assert store.has_product(prod_id), 'Unknown product'
store.get_product(prod_id).delete()
Was aber geschieht, wenn Zusicherungen deaktiviert sind?
Durch die unsachgemäße Verwendung von Zusicherungen weist diese Funktion von nur drei Zeilen gleich zwei schwere Probleme auf:
Die Überprüfung auf Administratorrechte mithilfe einer Zusicherung ist gefährlich.
Wenn Zusicherungen im Python-Interpreter deaktiviert sind, werden sie zu Nulloperationen, und dann kann
jeder Benutzer Produkte löschen
. Die Rechteüberprüfung wird nicht ausgeführt. Das ist ein Sicherheitsproblem, denn es öffnet Angreifern Tür und Tor, um Daten in deinem Onlineshop zu löschen oder zu beschädigen.
Die Überprüfung mit has_prodcut() findet bei deaktivierten Zusicherungen nicht statt.
Dadurch kann
get_product()
auch mit einer ungültigen Produkt-ID aufgerufen werden. Das kann je nachdem, wie dein Programm geschrieben ist, weitere schwere Fehler hervorrufen. Schlimmstenfalls kann damit jemand einen Denial-of-Service-Angriff gegen deinen Shop starten. Wenn die Anwendung abstürzt, sobald jemand ein unbekanntes Produkt zu löschen versucht, könnte ein Angreifer sie durch ein Bombardement ungültiger Löschanforderungen zum Erliegen bringen.
Wie kannst du solche Probleme vermeiden? Dadurch, dass du Zusicherungen niemals zur Datenvalidierung verwendest. Stattdessen kannst du dazu reguläre if-Anweisungen und Ausnahmen einsetzen:
def delete_product(product_id, user):
if not user.is_admin():
raise AuthError('Must be admin to delete')
if not store.has_product(product_id):
raiseValueError('Unknown product id')
store.get_product(product_id).delete()
Das bietet den zusätzlichen Vorteil, dass dabei keine unspezifischen AssertionError-Ausnahmen, sondern aussagekräftige ValueError- oder AuthError-Ausnahmen ausgelöst werden, die wir selbst definieren müssen.
Es ist erstaunlich einfach, in Python assert-Zuweisungen zu schreiben, die immer True sind. Das ist mir selbst auch schon passiert. Wenn du in einer assert-Anweisung ein Tupel als erstes Argument übergibst, wird die Zusicherung immer True sein und niemals fehlschlagen. Das ist beispielsweise bei der folgenden Zusicherung der Fall:
assert(12, 'This should fail')
Das liegt daran, dass nicht leere Tupel in Python immer als »truthy« angesehen werden. Wenn du ein Tupel an eine assert-Anweisung übergibst, wird die Bedingung daher stets als wahr angesehen. Die Zusicherung ist damit aber nutzlos, da sie niemals eine Ausnahme auslösen kann.
Aufgrund dieses der Intuition widersprechenden Verhaltens ist es relativ einfach, schlechte mehrzeilige Zusicherungen zu schreiben. So habe ich beispielsweise einmal in einer Testsuite fröhlich eine ganze Reihe funktionsunfähiger Testfälle geschrieben, die mir ein falsches Gefühl der Sicherheit gegeben haben. Stell dir vor, du verwendest eine Zusicherung wie die folgende in einem Unit-Test:
assert (
counter 10,
'It should have counted all the items'
)
Auf den ersten Blick sieht dieser Test gut aus. In Wirklichkeit kannst du damit aber niemals ein falsches Ergebnis abfangen, da die Zusicherungen unabhängig vom Zustand der Variablen counter stets zu True ausgewertet werden. Und warum ist das so? Weil der Wahrheitswert des Tupelobjekts betrachtet wird.
Wie ich schon sagte, ist es damit ziemlich einfach, sich selbst ins Knie zu schießen (meins tut immer noch weh). Ein guter Schutz dagegen besteht darin, ein Quellcodeanalyse-Werkzeug4 zu verwenden. In neueren Versionen von Python 3 wird bei solchen zweifelhaften Zusicherungen auch eine Syntaxwarnung angezeigt.
Aus diesem Grunde sollst du Folgendes bei deinen Unit-Tests auch immer überprüfen. Vergewissere dich immer, dass ein Test tatsächlich fehlschlagen kann, bevor du den nächsten schreibst.
Trotz dieser Stolpersteine sind Zusicherungen ein wertvolles Debuggingwerkzeug, das von vielen Python-Entwicklern zu wenig genutzt wird. Kenntnisse über die Funktionsweise und die korrekte Anwendung von Zusicherungen helfen dabei, Python-Programme zu schreiben, die wartungsfreundlicher sind und sich einfacher debuggen lassen. Dies ist eine wertvolle Fähigkeit, mit der du Python noch besser beherrschst und zu einem besseren Pythonista wirst. Mir hat sie beim Debugging viele Stunden Zeitaufwand erspart.
Die Python-Anweisung
assert
ist eine Debugginghilfe, die als ein interner Selbsttest des Programms eine Bedingung prüft.
Zusicherungen dürfen ausschließlich dafür verwendet werden, Bugs zu finden. Sie sind kein Mechanismus für die Handhabung von Laufzeitfehlern.
Zusicherungen können über eine Interpreter-Einstellung global ausgeschaltet werden.
Für den Fall, dass du in Python Elemente aus einer Liste, einem Dictionary oder einer Menge entfernen oder sie hinzufügen musst, habe ich einen praktischen Tipp: Schließe immer alle Zeilen mit einem Komma ab. Nehmen wir beispielsweise an, dein Code enthält die folgende Liste von Namen:
Wenn du diese Liste änderst, ist es bei der Betrachtung einer Git-Differenzanzeige meistens schwer zu erkennen, was du genau geändert hast. Die meisten Versionsverwaltungen arbeiten zeilenbasiert und können daher mehrere Änderungen in einer einzigen Zeile nur schwer hervorheben. Das kannst du einfach beheben, indem du dir einen Programmierstil angewöhnst, in dem du Listen, Dictionarys und Mengen wie folgt über mehrere Zeilen verteilst:
Dadurch steht jedes Element in einer einzigen Zeile. Du kannst so in einer Differenzanzeige auf den ersten Blick erkennen, was hinzugefügt, entfernt oder geändert wurde. Diese winzige Änderung hat mir geholfen, dumme Fehler zu vermeiden, und erleichtert es auch meinen Teamkollegen, meine Codeänderungen zu überprüfen.
Es gibt jedoch zwei Fälle, in denen immer noch Verwirrung auftreten kann. Wenn du ein neues Element am Ende der Liste hinzufügst oder das letzte Element entfernst, musst du die Kommasetzung manuell korrigieren. Nehmen wir an, du fügst der Liste als weiteren Namen Jane hinzu. Dabei musst du ein Komma hinter Dilbert einfügen, da sonst ein böser Fehler auftritt:
Wenn du dir nun den Inhalt dieser Liste ansiehst, steht dir eine Überraschung bevor:
>>> names
['Alice', 'Bob', 'DilbertJane']
Wie du siehst, hat Python die Strings Dilbert und Jane zu DilbertJane verschmolzen. Diese Verkettung von Stringliteralen ist ein beabsichtigtes und dokumentiertes Verhalten. Aber es ist auch eine wunderbare Möglichkeit, um schwer zu findende Bugs in seine Programme einzubauen:
Mehrere benachbarte String- oder Byteliterale (getrennt durch Leerzeichen) sind zulässig, auch mit unterschiedlichen Anführungszeichen. Das Ergebnis ist äquivalent zur Verkettung mit dem Operator +.5
Die Stringliteralverkettung ist in einigen Fällen eine praktische Sache. Beispielsweise brauchst du dadurch weniger Schrägstriche, um lange Stringkonstanten über mehrere Zeilen zu verteilen:
Wie wir gerade gesehen haben, kann diese Vorkehrung jedoch auch zu einem Problem führen. Wie beheben wir diese Situation?
Durch Hinzufügen des fehlenden Kommas hinter Dilbert verhinderst du, dass die beiden Strings verschmolzen werden:
Damit stellt sich uns aber wieder das ursprüngliche Problem: Ich musste zwei Zeilen ändern, um den neuen Namen zu der Liste hinzuzufügen. Dadurch wird es schwieriger, in der Git-Differenzanzeige zu erkennen, was geändert wurde. Wurde ein neuer Name hinzugefügt? Wurde Dilberts Name geändert?
Zum Glück lässt uns die Syntax von Python einigen Spielraum, um das Kommaproblem ein für allemal zu lösen. Du musst dir dazu lediglich einen Programmierstil angewöhnen, bei dem dieses Problem gar nicht erst auftreten kann.
In Python kann hinter jedem Element einer Liste, eines Dictionarys und einer Menge ein Komma stehen – auch hinter dem letzten. Dadurch kannst du einfach jede Zeile mit einem Komma abschließen und musst bei Änderungen am Ende der Liste keine Kommata manuell hinzufügen. Damit sieht unser Beispiel wie folgt aus:
Das Komma hinter Dilbert macht es möglich, neue Elemente hinzuzufügen und zu entfernen, ohne die Kommasetzung ändern zu müssen. Alle Zeilen sind einheitlich, die Differenzanzeige ist übersichtlicher, und diejenigen, die deinen Code überprüfen, werden sehr zufrieden sein. Manchmal sind es eben die kleinen Dinge, die große Wirkung entfalten.
Durch geschickte Formatierung und Kommasetzung kannst du Listen, Dictionarys und Mengen wartungsfreundlicher gestalten.
Die Stringliteralverkettung von Python kannst du zu deinem Vorteil nutzen, aber sie kann auch zu schwer zu findenden Bugs führen.
Manche sehen die Python-Anweisung with als eher obskur an. Wenn du aber einen Blick hinter die Kulissen wirfst, wirst du feststellen, dass sie tatsächlich sehr hilfreich ist, um saubereren und besser lesbaren Python-Code zu schreiben. Wozu ist die Anweisung with also gut? Sie ermöglicht es, einige gängige Muster der Ressourcenverwaltung zu vereinfachen, indem sie deren Funktion verbirgt und es erlaubt, sie wiederzuverwenden. Ein gutes Beispiel für die wirkungsvolle Anwendung dieser Anweisung findest du in der Standardbibliothek von Python, und zwar in der integrierten Funktion open():
with open('hello.txt', 'w') as f:
f.write('hello, world!')
Es wird gewöhnlich empfohlen, Dateien mit with zu öffnen, da dadurch garantiert wird, dass offene Dateideskriptoren automatisch geschlossen werden, wenn die Programmausführung den Kontext der with-Anweisung verlässt. Intern wird der vorstehende Beispielcode in etwas wie das Folgende umgewandelt:
Dieser Code ist deutlich umfangreicher. Von besonderer Bedeutung ist hier die try...finally-Anweisung. Es würde nicht ausreichen, einfach Folgendes zu schreiben:
Bei dieser Implementierung ist nicht garantiert, dass die Datei geschlossen wird, wenn während des Aufrufs von f.write() eine Ausnahme auftritt. Das Programm kann dann in den Dateideskriptor überlaufen. Aus diesem Grund ist die Anweisung with so praktisch: Damit wird es ganz einfach, Ressourcen ordnungsgemäß zu erwerben und freizugeben.
Ein weiteres gutes Beispiel für den wirkungsvollen Einsatz der Anweisung with in der Python-Standardbibliothek ist die Klasse threading.Lock:
In beiden Fällen kapselt die Anweisung with den Großteil der Logik zur Handhabung der Ressource. Du musst nicht jedes Mal ausdrückliche try...finally-Anweisungen schreiben, da sich with darum kümmert. Die Anweisung with kann Code für den Umgang mit Systemressourcen besser lesbar machen. Sie hilft auch, Bugs und Lecks zu vermeiden, da sie es praktisch unmöglich macht, das Aufräumen oder die Freigabe von Ressourcen zu vergessen, die nicht mehr benötigt werden.
Dass du die Funktion open() und die Klasse threading.Lock zusammen mit with einsetzen kannst, ist keine besondere Sache. Durch die Implementierung des Kontextmanagers6 kannst du das Gleiche auch bei deinen eigenen Klassen und Funktionen erreichen.
Was ist ein Kontextmanager? Es handelt sich dabei um ein einfaches »Protokoll« (eine Schnittstelle), dem deine Objekte entsprechen müssen, um die Anweisung with nutzen zu können. Du musst ihm dazu im Grunde genommen nur die Methoden __enter__ und __exit__ hinzufügen. Python ruft diese beiden Methoden während des Ressourcenverwaltungszyklus jeweils zum richtigen Zeitpunkt auf. Sehen wir uns an, wie das in der Praxis abläuft. Eine einfache Implementierung des open()-Kontextmanagers sieht wie folgt aus:
Die Klasse ManagedFile erfüllt das Kontextmanagerprotokoll und unterstützt ebenso wie die ursprüngliche Funktion open() die Anweisung with:
>>>with ManagedFile('hello.txt') as f:
... f.write('hello, world!')
... f.write('bye now')
Wenn die Ausführung in den Kontext der with-Anweisung eintritt und es an der Zeit ist, die Ressource zu sammeln, ruft Python __enter__ auf. Verlässt die Ausführung den Kontext wieder, wird dagegen __exit__ aufgerufen, um die Ressource freizugeben.
Du kannst mit der Anweisung with nicht nur dadurch arbeiten, dass du einen Kontextmanager auf der Grundlage einer Klasse schreibst. Das Modul contextlib7 aus der Standardbibliothek bietet noch weitere Abstraktionen, die auf dem grundlegenden Kontextmanagerprotokoll aufbauen. Wenn die Möglichkeiten von contextlib für deinen Anwendungsfall geeignet sind, kannst du dir damit die Arbeit ein wenig erleichtern.
Beispielsweise kannst du den Dekorator contextlib.contextmanager verwenden, um eine generatorgestützte Factory-Funktion für eine Ressource zu definieren, die dann automatisch with unterstützt. Wenn wir diese Technik anwenden, sieht unser Kontextmanager ManagedFile wie folgt aus:
Bei managed_file() handelt es sich um einen Generator, der zunächst die Ressource anfragt. Anschließend aber hält er seine eigene Ausführung an und tritt die Ressource ab, sodass der Aufrufer sie verwenden kann. Wenn der Aufrufer den Kontext von with verlässt, nimmt der Generator die Ausführung wieder auf, sodass er alle noch verbleibenden Aufräumvorgänge ausführen und die Ressource wieder freigeben kann.
Die Klassen- und die Generatorimplementierung des Kontextmanagers sind praktisch gleichwertig. Vielleicht ist die eine Variante für dich besser lesbar als die andere, aber das ist Geschmackssache.
Ein Nachteil der Implementierung mit @contextmanager besteht darin, dass dazu Kenntnisse anspruchsvollerer Python-Konzepte wie Dekorator und Generatoren erforderlich sind. Wenn du dein Wissen zu diesen Konzepten noch einmal vertiefen musst, schlage ruhig in den entsprechenden Kapiteln dieses Buches nach. Was die richtige Implementierung ist, hängt jedoch davon ab, womit du und dein Team am besten zurechtkommen und was du für übersichtlicher hältst.
Kontextmanager sind sehr flexibel. Mit dem kreativen Einsatz der Anweisung with kannst du bequem APIs für deine Module und Klassen schreiben. Nehmen wir beispielsweise an, bei der »Ressource«, die wir verwalten wollen, handelt es sich um die Einrückungsebenen in einem Berichtsgenerator. Stell dir vor, wir würden dazu Code wie den folgenden schreiben:
with Indenter() as indent:
indent.print('hi!')
with indent:
indent.print('hello')
with indent:
indent.print('bonjour')
indent.print('hey')
Das liest sich fast wie eine fachbereichsspezifische Sprache (Domain-Specific Language, DSL) für die Einrückung von Text. Beachte auch, dass dieser Code mehrmals in denselben Kontextmanager eintritt und ihn wieder verlässt, um die Einrückungsebenen zu ändern. Die Ausführung dieses Codeausschnitts führt dazu, dass der folgende sauber formatierte Text an der Konsole ausgegeben wird:
hi!
hello
bonjour
hey
Wie kannst du einen Kontextmanager implementieren, der so etwas ermöglicht? Das ist übrigens eine hervorragende Übung, um die Funktionsweise von Kontextmanagern genau kennenzulernen. Bevor du dir meine nachfolgende Implementierung ansiehst, solltest du dir daher etwas Zeit nehmen, um dich an einer eigenen Implementierung zu versuchen.
Hast du das gemacht? Dann siehst du hier eine mögliche Implementierung mithilfe eines klassenbasierten Kontextmanagers:
Das war gar nicht so schwer, oder? Ich hoffe, dass es dir jetzt schon leichterfällt, Kontextmanager und die Anweisung with in deinen eigenen Python-Programmen einzusetzen. Das ist eine hervorragende Möglichkeit, um die Ressourcenverwaltung auf eine viel phytonischerer und wartungsfreundlichere Weise zu erledigen.
Wenn du gern noch weitere Übungen durchführen möchtest, um deine Kenntnisse zu vertiefen, versuche einen Kontextmanager zu implementieren, der die Ausführungszeit eines Codeblocks mit der Funktion time.time misst. Schreibe dabei sowohl eine Dekorator- als auch eine Klassenvariante, um die Unterschiede dazwischen genau kennenzulernen.
Die Anweisung
with
vereinfacht die Ausnahmebehandlung, da sie die reguläre Verwendung von
try/finally
-Anweisungen in sogenannten Kontextmanagern kapselt.
Am häufigsten wird
with
für die sichere Verwaltung von Systemressourcen verwendet. Die Ressource wird durch
with
angefragt, und die Freigabe erfolgt, wenn die Ausführung den Kontext von
with
verlässt.
Die korrekte Verwendung von
with
kann dabei helfen, Ressourcenlecks zu vermeiden und deinen Code lesbarer zu gestalten.
Einfache und doppelte Unterstriche in Variablen- und Methodennamen haben eine besondere Bedeutung. Einige dieser Bedeutungen sind lediglich Konventionen und dienen als Hinweise für Programmierer, während andere tatsächlich vom Python-Interpreter genutzt werden.