# Langage Python

Création début années 90 par Guido van Rossum (Pays-Bas)
- Version 2.0 en 2000
- Version 3.0 en 2008 (non retro-compatible)

Caractéristiques:
- langage haut-niveau, interprété
- multi-paradigme: programmation impérative, fonctionnelle et orientée objet
- typage dynamique (type déterminé à l'execution)
- typage fort (pas de conversion implicite)
- gestion automatique de la mémoire (_garbage collector_)
- syntaxe lisible et épuré

Langage de plus en plus utilisé: beaucoup de contributions et de librairies (modules) disponibles pour le **calcul scientifique** (alternative à MATLAB/Scilab), **l'analyse de données** (alternative à `R`) et le **machine learning** (`sklearn`) ou le **deep learning** (`pytorch`, `tensorflow`).

In [1]:
from platform import python_version
print("Version de python utilisée dans ce notebook:", python_version())

Version de python utilisée dans ce notebook: 3.10.8


## Modules, mots-clés

### Import d'un module

In [2]:
import math                  # import du module math
math.sqrt(25)

5.0

In [3]:
from math import sqrt        # import d'une fonction
sqrt(25)                     # plus besoin du nom du module

5.0

In [4]:
from math import cos, floor  # import de plusieurs fonctions
from csv import *      # import de toutes les fonctions d'un module (déconseillé)
import datetime as dt  # définition d'un alias

In [5]:
print(dir(math))             # liste des fonctions du module math

['__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'ceil', 'comb', 'copysign', 'cos', 'cosh', 'degrees', 'dist', 'e', 'erf', 'erfc', 'exp', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf', 'isnan', 'isqrt', 'lcm', 'ldexp', 'lgamma', 'log', 'log10', 'log1p', 'log2', 'modf', 'nan', 'nextafter', 'perm', 'pi', 'pow', 'prod', 'radians', 'remainder', 'sin', 'sinh', 'sqrt', 'tan', 'tanh', 'tau', 'trunc', 'ulp']


### Mots-clés réservés

In [6]:
import keyword
print(keyword.kwlist)       # liste des mots-clés du langage

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


Pour connaître les fonctions disponibles on consulte la page de la documentation officielle. Voici une façon d'afficher une page web à l'intérieur d'un notebook: 

In [149]:
from IPython.display import IFrame
doc = IFrame(src='https://docs.python.org/3/library/functions.html#built-in-funcs',
             width=700,height=500)
doc

In [8]:
help(round)

Help on built-in function round in module builtins:

round(number, ndigits=None)
    Round a number to a given precision in decimal digits.
    
    The return value is an integer if ndigits is omitted or None.  Otherwise
    the return value has the same type as the number.  ndigits may be negative.



In [9]:
round?

[0;31mSignature:[0m [0mround[0m[0;34m([0m[0mnumber[0m[0;34m,[0m [0mndigits[0m[0;34m=[0m[0;32mNone[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Round a number to a given precision in decimal digits.

The return value is an integer if ndigits is omitted or None.  Otherwise
the return value has the same type as the number.  ndigits may be negative.
[0;31mType:[0m      builtin_function_or_method


### Quelques librairies python

Domaine | Nom du module
--- | ---
N-dimensional array package | NumPy
Scientific Computation | SciPy
Plotting | Matplotlib, seaborn
Data Analysis | pandas
Symbolic Computation | Sympy
Networking | networkx
Machine Learning | scikit-learn
Deep Learning | tensorflow, pytorch
Image Processing | scikit-image
Natural Language Processing | nltk
Cryptography | pyOpenSSL
Game Development | PyGame
Graphic User Interface | pyQT
Database | SQLAlchemy
HTML and XML parsing | BeautifulSoup

Il existe aussi des modules pour améliorer les performances du code python en utilisant de la compilation à la volée (Just In Time compilation ou JIT):
- [Numba](https://numba.pydata.org/) compilation CPU/GPU
- [JAX](https://jax.readthedocs.io/en/latest/notebooks/quickstart.html) différentiation automatique et compilation CPU/GPU

## Généralités: types, opérations, tests et boucles

Il existe trois types numériques distincts: 
- `int` pour les entiers (précision illimitée), 
- `float` pour les réels (nombres flottants, précision dépend de l'architecture),
- `complex` pour les nombres complexes (constante imaginaire pure: `j`).

Il y a un type `bool` pour les expressions booléenes dont les constantes sont `True` et `False`.

La [documentation](https://docs.python.org/fr/3/library/stdtypes.html) fournit toutes les informations détaillées.

### Manipulation de types

In [10]:
x = 2.0
type(x)

float

In [11]:
x = '2'     # x change de type, le x du contexte précédent est écrasé
type(x)

str

In [12]:
isinstance(x, int)      # est-ce que x est un entier ? 

False

In [13]:
x = int(x)  # conversion de la string en int (erreur à l'execution si impossible)
isinstance(x, (int, float))  # est-ce que x est un entier ou un réel ?

True

In [14]:
x

2

In [15]:
print("La constante True est de type: ", type(True))
print("La constante None est de type: ", type(None))
print("Le nombre 2+3j est de type:", type(2+3j))

La constante True est de type:  <class 'bool'>
La constante None est de type:  <class 'NoneType'>
Le nombre 2+3j est de type: <class 'complex'>


### Types composés: structure de données
Il y a quelques types composés qu'il faut maitriser. On détaille l'usage plus loin dans ce notebook. On peut regrouper les **structures ordonnées**: 
- une collection hétérogène modifiable `list` `[]` 
- une collection non modifiable `tuple` `()`
- une chaine de caractère `str` `""` ou `''`

In [16]:
type([1, 'a', 0.2])

list

In [17]:
type((1, 'a', 0.2))

tuple

In [18]:
type("abc")

str

Et les **structures non ordonnées**:
- structure associative (table de hashage) ou dictionnaire `dict` `{:}`
- collection non ordonnée: `set` `{}` ou `frozenset`

In [19]:
from math import exp, pi 
cnsts = {'e': exp(1), 'pi': pi}
print(cnsts)
type(cnsts)

{'e': 2.718281828459045, 'pi': 3.141592653589793}


dict

In [20]:
ens = {1, 'a', 0.2, "abc"}
print(ens)
type(ens)

{0.2, 1, 'a', 'abc'}


set

D'autres types composés sont disponibles dans le module [`collections`](https://docs.python.org/3/library/collections.html#module-collections).

### Opérations arithmétiques

In [21]:
20 + 3          # 23   (type int)
20 + 3.         # 23.0 (type float)

20 * 3          # 60
20 ** 3         # 8000 (puissance)

20 / 3          # 6.666666666666667 
20 // 3         # 6 (division entière) 

20 % 3          # 2 (modulo) 
(2+3j) + (4-7j) # 6-4j  
(9+5j).real     # 9.0 
(9+5j).imag     # 5.0 
abs(3+4j)       # 5.0 (module)

5.0

In [22]:
'a' + 'b'       # concaténation

'ab'

In [23]:
# si on execute cette cellule on a une erreur
#'a' + 2         # fortement typé, différent du javascript

### Remarques sur le type `int`

En Python les entiers sont codés avec un type particulier dont le nombre de bits en mémoire est variable: cela permet de manipuler des entiers aussi grands que l'on veut. 

Par exemple on peut afficher les nombres suivants: $10!$, $100!$, $1000!$...

In [24]:
from math import factorial
print("10! = ", factorial(10))
print("100! = ", factorial(100))
print("1000! = ", factorial(1000))

10! =  3628800
100! =  93326215443944152681699238856266700490715968264381621468592963895217599993229915608941463976156518286253697920827223758251185210916864000000000000000000000000
1000! =  40238726007709377354370243392300398571937486421071463254379991042993851239862902059204420848696940480047998861019719605863166687299480855890132382966994459099742450408707375991882362772718873251977950595099527612087497546249704360141827809464649629105639388743788648733711918104582578364784997701247663288983595573543251318532395846307555740911426241747434934755342864657661166779739666882029120737914385371958824980812686783837455973174613608537953452422158659320192809087829730843139284440328123155861103697680135730421616874760967587134831202547858932076716913244842623613141250878020800026168315102734182797770478463586817016436502415369139828126481021309276124489635992870511496497541990934222156683257208082133318611681155361583654698404670897560290095053761647584772842188967964624494516076535340819890

Pour information, on peut connaitre la taille en mémoire d'une variable python en utilisant la fonction `getsizeof` du module `sys`. 

In [25]:
from sys import getsizeof
help(getsizeof)
print(getsizeof(factorial(10)))
print(getsizeof(factorial(100)))
print(getsizeof(factorial(1000)))

Help on built-in function getsizeof in module sys:

getsizeof(...)
    getsizeof(object [, default]) -> int
    
    Return the size of object in bytes.

28
96
1164


Si on compare après conversion d'un `int` en `float` (type pour les réels similaire à `double` en `C/C++`) de taille fixe.

In [26]:
print(getsizeof(float(factorial(10))))
print(getsizeof(float(factorial(100))))
# il y a une erreur si on execute l'instruction suivante:
# print(getsizeof(float(factorial(1000))))

24
24


**Remarque:** la taille maximale d'un `float` est de ? cf. [wikipedia](https://en.wikipedia.org/wiki/Double-precision_floating-point_format).

### Opérations booléennes

In [27]:
x = 5
x >= 3

True

In [28]:
print(x != 3, x == 3)

True False


In [29]:
x > 3 and 6 > 3     # 'et' booléen

True

In [30]:
x > 3 or 5 < 3     # 'ou' booléen

True

In [31]:
not x > 3

False

**Priorité (ordre d'évaluation):** `not`, `and` puis `or`

### Tests `if`/`elif`/`else`

In [32]:
if x > 0:
    print('positive') # attention: indentation permet de définir un bloc d'instructions
    print('coucou')
else:                 # else facultatif
    print('zero or negative')

positive
coucou


In [33]:
if x > 0:
    print('positive')
elif x == 0:                   # elif pour enchainer les conditions
    print('zero')
else:
    print('negative')

positive


In [34]:
if x > 0: print('positive')    # possible en une ligne

positive


Possibilité d'écrire une _expression conditionnelle_

In [35]:
'positive' if x > 0 else 'zero or negative'    # expression conditionnelle: en C++ (x > 0) ? 'positive' : 'zero or negative' 

'positive'

### Itérations, boucles

#### Boucle while

In [36]:
N = 0
x = x0 = 1024
while x > 0: 
    x //= 2
    N += 1
print(f"Approximation de log_2({x0}): {N-1}")

Approximation de log_2(1024): 10


#### Itérable et `range`

In [37]:
range(10)         # définit la plage itérable {0,1,2,..,9} (ouvert à droite)
range?

[0;31mInit signature:[0m [0mrange[0m[0;34m([0m[0mself[0m[0;34m,[0m [0;34m/[0m[0;34m,[0m [0;34m*[0m[0margs[0m[0;34m,[0m [0;34m**[0m[0mkwargs[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m     
range(stop) -> range object
range(start, stop[, step]) -> range object

Return an object that produces a sequence of integers from start (inclusive)
to stop (exclusive) by step.  range(i, j) produces i, i+1, i+2, ..., j-1.
start defaults to 0, and stop is omitted!  range(4) produces 0, 1, 2, 3.
These are exactly the valid indices for a list of 4 elements.
When step is given, it specifies the increment (or decrement).
[0;31mType:[0m           type
[0;31mSubclasses:[0m     


In [38]:
for i in range(0, 101, 10):
    print(i)

0
10
20
30
40
50
60
70
80
90
100


#### Boucle `for`

In [39]:
jours = ['lundi', 'mardi', 'mercredi']   # une liste
for i in range(len(jours)):              # à éviter
    print(jours[i])

lundi
mardi
mercredi


In [40]:
# erreur si on execute cette cellule 
#jours = {'lundi', 'mardi', 'mercredi'}   # un ensemble
#for i in range(len(jours)):              
#    print(jours[i])                      # ne fonctionne pas

In [41]:
for day in jours:          # fonctionne dès que jours est itérable
    print(day)

lundi
mardi
mercredi


**Utilisation d'** `enumerate`

In [42]:
for index, day in enumerate(jours):
    print(index, day)

0 lundi
1 mardi
2 mercredi


**Utilisation de** `zip`

In [43]:
planetes = { 'mars', 'mercure', 'terre', 'venus' }  # ensemble non ordonné! 
print(planetes)

{'mercure', 'mars', 'terre', 'venus'}


In [44]:
for jour, planete in zip(jours, planetes): # parcourt conjoint des itérables jours et Ps
    print(jour, planete)

lundi mercure
mardi mars
mercredi terre


**Boucle** `for/else`

In [45]:
for day in jours:          # fonctionne dès que jours est itérable
    if day == 'dimanche':
        print(day)
        break
else:                      # attention à l'indentation
    print('pas de dimanche!')

pas de dimanche!


## Fonctions

Attention une fonction peut dépendre et interagir avec un contexte global: ce n'est pas une fonction au sens mathématique. 

Une fonction qui ne dépend que de ses arguments est dite _fonction pure_ ou _sans effet de bord_: écriture recommandée.

**Syntaxe:** 
```python
def nom_fonction(arguments):
      instructions
```
Pour renvoyer une valeur on utilise le mot-clé `return`.

### Arguments

- **positional argument**: un argument qui n'est pas suivi par un signe `=` (n'a pas de valeur par défaut)
- **keyword argument**: argument suivi par un signe `=` et une expression qui donne une valeur par défaut

On indique d'abord les _positional arguments_ puis les _keyword arguments_.

In [46]:
def g(a, b, t=0.5):
    z = a + t * (b - a)       # z est une variable locale
    return z

In [47]:
print( g(1, 6) )             # t prend la valeur par defaut, a vaut 1 et b vaut 6
print( g(1, 6, 0.2) )        # a et b sont déterminés par la position
print( g(t=0.2, b=6, a=1) )  # arguments déterminés par leurs noms
print( g(b=6, a=1) )         
print( g(1, t=0.2, b=6) )   # a vaut 1 car en première position
print( g(1, b=6) ) 

3.5
2.0
2.0
3.5
2.0
3.5


### Valeurs de retour

In [48]:
epsilon = 0.1                         # variable globale
def move(x, y):
    return x + epsilon, y * epsilon   # fonction retourne un tuple

In [49]:
move(0.1, 10)

(0.2, 1.0)

In [50]:
epsilon = 0.5
move(0.1, 10)             # comportement dépend du contexte: à éviter en général

(0.6, 5.0)

In [51]:
a, b = move(0.1, 10)      # tuple unpacking
print("a =", a)
print("b =", b)

a = 0.6
b = 5.0


### Fonctions anonymes `lambda`

In [52]:
squared = lambda x: x**2   # fonction anonyme stockée dans la variable squared
squared(4)

16

**Exemple d'utilisation:** trier une liste de mot dont l'ordre est donné par la dernière lettre

In [53]:
planetes

{'mars', 'mercure', 'terre', 'venus'}

In [54]:
def last_letter(word):
    return word[-1]
sorted(planetes, key=last_letter)           # version avec la fonction last_letter

['mercure', 'terre', 'mars', 'venus']

In [55]:
?sorted

[0;31mSignature:[0m [0msorted[0m[0;34m([0m[0miterable[0m[0;34m,[0m [0;34m/[0m[0;34m,[0m [0;34m*[0m[0;34m,[0m [0mkey[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mreverse[0m[0;34m=[0m[0;32mFalse[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Return a new list containing all items from the iterable in ascending order.

A custom key function can be supplied to customize the sort order, and the
reverse flag can be set to request the result in descending order.
[0;31mType:[0m      builtin_function_or_method


In [56]:
sorted(planetes, key=lambda word: word[-1]) # version avec une lambda fonction

['mercure', 'terre', 'mars', 'venus']

### Modification des arguments

Les arguments sont passés par adresse et peuvent dont être modifiés par une fonction (s'ils sont de type modifiable: pas le cas des tuples, `frozenset`...)

In [57]:
def repeat(x):
    x *= 2
    return x

a = [1, 2]  # liste modifiable

print("Argument avant l'appel:\t", a)
print("Résultat de l'appel:\t", repeat(a))
print("Argument après l'appel:\t", a)

Argument avant l'appel:	 [1, 2]
Résultat de l'appel:	 [1, 2, 1, 2]
Argument après l'appel:	 [1, 2, 1, 2]


In [58]:
a = (1, 2)  # tuple non modifiable

print("Argument avant l'appel:\t", a)
print("Résultat de l'appel:\t", repeat(a))
print("Argument après l'appel:\t", a)

Argument avant l'appel:	 (1, 2)
Résultat de l'appel:	 (1, 2, 1, 2)
Argument après l'appel:	 (1, 2)


## Détails des structures composées:

### Listes `[]`

- collection **hétérogène**: composée d'objets de types quelconques
- collection **ordonnée**, **itérable**, indexée à partir de 0 <br />(indices négatifs pour partir de la fin)
- collection **modifiable**: la taille et le contenu peuvent changer

**Syntaxe:** crochets `[]` et virgule qui sépare les éléments.

_Attention:_ il peut y avoir répétition: cette collection n'est pas un ensemble.

#### Création, manipulation de listes

In [59]:
liste_vide = []     # ou list()
planetes = ['venus', 'terre', 'mars']

planetes.append('mercure')      # ajout à la fin 
planetes

['venus', 'terre', 'mars', 'mercure']

In [60]:
planetes.extend(['jupyter', 'saturne'])
planetes

['venus', 'terre', 'mars', 'mercure', 'jupyter', 'saturne']

In [61]:
planetes.append(0)
planetes

['venus', 'terre', 'mars', 'mercure', 'jupyter', 'saturne', 0]

In [62]:
planetes.insert(0, 'mercure')   # insertion à la position 0 (1ère position)
planetes

['mercure', 'venus', 'terre', 'mars', 'mercure', 'jupyter', 'saturne', 0]

In [63]:
planetes.remove('mercure')      # supprime le 1er 'mercure'
planetes

['venus', 'terre', 'mars', 'mercure', 'jupyter', 'saturne', 0]

In [64]:
planetes.pop(0)       # supprime 1er élément et le renvoie

'venus'

In [65]:
planetes

['terre', 'mars', 'mercure', 'jupyter', 'saturne', 0]

In [66]:
del planetes[0]       # supprime 1er élément
planetes

['mars', 'mercure', 'jupyter', 'saturne', 0]

In [67]:
planetes[0] = 'terre' # remplace le 1er élément
planetes

['terre', 'mercure', 'jupyter', 'saturne', 0]

In [68]:
planetes = planetes + ['venus', 'terre', 'mars']   # plus lent qu'extend
planetes

['terre', 'mercure', 'jupyter', 'saturne', 0, 'venus', 'terre', 'mars']

In [69]:
planetes.count('terre')    # compte le nombre de 'terre'

2

In [70]:
planetes.index('terre')    # renvoie le 1er 'terre'

0

#### Appartenance, comparaison, copie

In [71]:
print(planetes)
'uranus' in planetes # operateur in renvoie un booléen

['terre', 'mercure', 'jupyter', 'saturne', 0, 'venus', 'terre', 'mars']


False

In [72]:
plnts = planetes        # attention: création d'un synonyme, par défaut on a un comportement par référence
plnts.pop(-1)           # on retire le dernier élément de la liste: -1 fait référence au dernier élément 
print(planetes)

['terre', 'mercure', 'jupyter', 'saturne', 0, 'venus', 'terre']


In [73]:
print("Même liste (objet) ? ", plnts is planetes)
print("Même contenu ? ", plnts == planetes)

Même liste (objet) ?  True
Même contenu ?  True


In [74]:
p_cpy = planetes.copy()  # création d'une copies: pour copie recursive il faut utiliser deepcopy
print(p_cpy)
print("Même liste (objet) ? ", p_cpy is planetes)
print("Même contenu ? ", p_cpy == planetes)

['terre', 'mercure', 'jupyter', 'saturne', 0, 'venus', 'terre']
Même liste (objet) ?  False
Même contenu ?  True


#### Accès aux éléments: _list slicing_

In [75]:
print(planetes)
planetes[0:2]     # 0 inclus et 2 exclu

['terre', 'mercure', 'jupyter', 'saturne', 0, 'venus', 'terre']


['terre', 'mercure']

In [76]:
planetes[:3]      # 0 implicite

['terre', 'mercure', 'jupyter']

In [77]:
planetes[3:]      # 4 = len(planetes) explicite

['saturne', 0, 'venus', 'terre']

In [78]:
planetes[-1]      # dernier élément similaire à planetes[len(planetes)-1]

'terre'

In [79]:
planetes[-2]      # avant-dernier

'venus'

In [80]:
planetes[::2]     # on fait des sauts de 2...

['terre', 'jupyter', 0, 'terre']

In [81]:
planetes[::-1] == list(reversed(planetes))

True

#### Trier

In [82]:
planetes.sort?

[0;31mSignature:[0m [0mplanetes[0m[0;34m.[0m[0msort[0m[0;34m([0m[0;34m*[0m[0;34m,[0m [0mkey[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mreverse[0m[0;34m=[0m[0;32mFalse[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Sort the list in ascending order and return None.

The sort is in-place (i.e. the list itself is modified) and stable (i.e. the
order of two equal elements is maintained).

If a key function is given, apply it once to each list item and sort them,
ascending or descending, according to their function values.

The reverse flag can be set to sort in descending order.
[0;31mType:[0m      builtin_function_or_method


In [83]:
planetes.remove(0)
print(planetes)

['terre', 'mercure', 'jupyter', 'saturne', 'venus', 'terre']


In [84]:
planetes.sort()     # sort in place: modification de la liste
planetes

['jupyter', 'mercure', 'saturne', 'terre', 'terre', 'venus']

In [85]:
len('jupyter')      # taille d'une chaine de caractères

7

In [86]:
planetes.sort(key=len)  # trie selon le nb de caractères de la planète
planetes

['terre', 'terre', 'venus', 'jupyter', 'mercure', 'saturne']

In [87]:
sorted?
sorted(planetes)

[0;31mSignature:[0m [0msorted[0m[0;34m([0m[0miterable[0m[0;34m,[0m [0;34m/[0m[0;34m,[0m [0;34m*[0m[0;34m,[0m [0mkey[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mreverse[0m[0;34m=[0m[0;32mFalse[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Return a new list containing all items from the iterable in ascending order.

A custom key function can be supplied to customize the sort order, and the
reverse flag can be set to request the result in descending order.
[0;31mType:[0m      builtin_function_or_method


['jupyter', 'mercure', 'saturne', 'terre', 'terre', 'venus']

#### Compréhension de liste

In [88]:
nums = [1, 2, 3, 4, 5]
cubes = []                    # on créé une liste vide
for num in nums:
    cubes.append(num**3)      # on ajoute les cubes
cubes

[1, 8, 27, 64, 125]

In [89]:
cubes = [x**3 for x in nums]  # même chose en plus court et lisible
cubes

[1, 8, 27, 64, 125]

In [90]:
pairs = [x for x in nums if x % 2 == 0] # version avec un filtre
pairs

[2, 4]

In [91]:
## exemple avec des listes imbriquées
L = [[0, 'a'], [2, 'b'], [3, 'c']]
result = [x*2 if type(x) == int else x*3 for elt in L for x in elt]
print(result)

[0, 'aaa', 4, 'bbb', 6, 'ccc']


Possible de faire de la compréhension de `dict` ou de `set`.

_Méthodes utilisables:_

In [92]:
## on définit cette fonction dont la syntaxe sera expliquée dans la suite 
def liste_methodes(obj): 
    return [func for func in dir(obj) if callable(getattr(obj, func)) and not func.startswith("__")]

In [93]:
print(liste_methodes(list))

['append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


#### Exercice: écrire une fonction 'insort'

*Important:* Si une fonctionnalité qui semble naturelle n'est pas présente dans la librairie de base il faut rechercher dans les modules standards de Python. 

Par exemple pour insérer un élément dans une liste triée et garder cet ordre on utilisera le module [bisect](https://docs.python.org/3/library/bisect.html):

In [94]:
from bisect import insort
?insort

[0;31mSignature:[0m [0minsort[0m[0;34m([0m[0ma[0m[0;34m,[0m [0mx[0m[0;34m,[0m [0mlo[0m[0;34m=[0m[0;36m0[0m[0;34m,[0m [0mhi[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0;34m*[0m[0;34m,[0m [0mkey[0m[0;34m=[0m[0;32mNone[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Insert item x in list a, and keep it sorted assuming a is sorted.

If x is already in a, insert it to the right of the rightmost x.

Optional args lo (default 0) and hi (default len(a)) bound the
slice of a to be searched.
[0;31mType:[0m      builtin_function_or_method


In [95]:
num = [10, 20, 40, 50]
print(num)

from bisect import insort
insort(num, 30)
num

[10, 20, 40, 50]


[10, 20, 30, 40, 50]

On considère une fonction qui permet d'insérer un élément `x` à sa bonne place dans une liste `a` supposée triée dans l'ordre croissant (on ne vérifie pas qu'elle est bien triée). Après l'insertion la liste `a` doit être encore triée dans l'ordre croissant.  

- Définir `insort_linear` qui code cette fonction en utilisant une recherche linéaire.

- Définir `insort_bsearch` qui code cette fonction en faisant une recherche binaire (dichotomie).

- Comparer les temps d'exécution avec la fonction `insort` du module `bisect`. 

##### Réponse

In [96]:
def insort_linear(a, x):
    """
    Insert item x in list a, and keep it sorted assuming a is sorted.
    Algo: linear search
    """
    for (i, y) in enumerate(a):
        if x < y:
            a.insert(i, x)
            break
    else:  # le cas où x est plus grand que tous les éléments de a  
        a.append(x)

In [97]:
from math import floor
def insort_bsearch(a, x):
    """
    Insert item x in list a, and keep it sorted assuming a is sorted.
    Algo: binary search
    """
    if x >= a[-1]: a.append(x) # cas particulier
    i, j = 0, len(a)-1
    while j > i+1:
        k = floor((i+j)/2)
        i, j = (i, k) if x < a[k] else (k, j) # attention aux parenthèses...
    a.insert(j, x)

In [98]:
n, x = 100000, 50000.2
liste = [ i for i in range(n) ]
%timeit insort_linear(liste, x)

2.82 ms ± 80.8 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [99]:
liste = [ i for i in range(n) ]
%timeit insort_bsearch(liste, x)

23.1 µs ± 529 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


In [100]:
liste = [ i for i in range(n) ]
%timeit insort(liste, x)

18.2 µs ± 518 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [101]:
%%timeit   # mesure le temps de calcul de toute la cellule
liste = [ i for i in range(n) ]
insort(liste, x)

3.36 ms ± 86.8 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


### Tuples `()`

- collection **hétérogène** (similaire à `list`)
- collection **ordonnée**, **itérable** (similaire à `list`)
- collection **non-modifiable** (_non-mutable_), différence avec `list`

**Syntaxe:** virgule qui sépare les éléments et parenthèses `()` optionnelles.

_Attention:_ il peut y avoir répétition: cette collection n'est pas un ensemble.


In [102]:
t = (2, 3, [3], 'c')  # création d'un tuple
t = 2, 3, [3], 'c'    # parenthèses optionnelles
print(t, type(t))
l = list(t)           # conversion en list
print(l, type(l)) 

(2, 3, [3], 'c') <class 'tuple'>
[2, 3, [3], 'c'] <class 'list'>


In [103]:
t + t                  # concaténation (comme pour les listes)
t * 3                  # répétition 3 fois

(2, 3, [3], 'c', 2, 3, [3], 'c', 2, 3, [3], 'c')

In [104]:
print(t)

(2, 3, [3], 'c')


In [105]:
a, b, c, d = t         # unpacking: très utilisé, on crée les variables a, b, c, d à partir du tuple
print(c)

[3]


In [106]:
i, j, k = 2, 3, 4      # initialisation des variables i, j et k via les tuples

In [107]:
print(*t)              # opéateur * pour exploser le tuple en arguments multiples 

2 3 [3] c


In [108]:
print(liste_methodes(t))

['count', 'index']


### Chaînes de caractères `''`

**Syntaxe:** suite de caractères délimitée par une paire de 
- guillemets simples `'`
- guillements doubles `"`
- guillements triples `'''`

Un objet de type `string` s'utilise comme une liste de caractères (unicode) avec quelques méthodes supplémentaires spécifiques aux caractères (`lower`, `upper`, `capitalize`,...)

Il existe des modificateurs à placer devant les guillemets:
- `r` pour indiquer que c'est une `raw-string`: utile pour les formules _LaTeX_
- `f` pour indiquer que c'est une `f-string` (depuis python 3.6)

#### Type `str`

In [109]:
s = str(2.1)                         # conversion en string
print(liste_methodes(s))             # les méthodes utilisables avec un string

['capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'removeprefix', 'removesuffix', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']


In [110]:
s

'2.1'

In [111]:
x = float(s)                         # conversion en float
print('Nombre x: ' + str(x))         # concaténation
print('Nombre x: {:.5e}'.format(x))  # écriture scientifique avec 5 décimales

Nombre x: 2.1
Nombre x: 2.10000e+00


In [112]:
s.split?

[0;31mSignature:[0m [0ms[0m[0;34m.[0m[0msplit[0m[0;34m([0m[0msep[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mmaxsplit[0m[0;34m=[0m[0;34m-[0m[0;36m1[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Return a list of the substrings in the string, using sep as the separator string.

  sep
    The separator used to split the string.

    When set to None (the default value), will split on any whitespace
    character (including \\n \\r \\t \\f and spaces) and will discard
    empty strings from the result.
  maxsplit
    Maximum number of splits (starting from the left).
    -1 (the default value) means no limit.

Note, str.split() is mainly useful for data that has been intentionally
delimited.  With natural text that includes punctuation, consider using
the regular expression module.
[0;31mType:[0m      builtin_function_or_method


In [113]:
st='  Bonjour le Monde     \nça va ?   \n  '
st.split()

['Bonjour', 'le', 'Monde', 'ça', 'va', '?']

In [114]:
print(st.upper())

  BONJOUR LE MONDE     
ÇA VA ?   
  


In [115]:
st.strip()

'Bonjour le Monde     \nça va ?'

In [116]:
print(st.startswith('B'))
print(st.strip().startswith('B'))     # on peut enchaîner les méthodes

False
True


In [117]:
st.split()

['Bonjour', 'le', 'Monde', 'ça', 'va', '?']

#### f-strings

In [118]:
print(f"Valeur de x: {x:.4e}")  # usage plus facile avec les f-string

Valeur de x: 2.1000e+00


In [119]:
import locale, datetime
locale.setlocale(locale.LC_TIME, "en_US") 
name = 'Clément'
birthday = datetime.date(2010, 1, 19)
today = datetime.date.today()
age = int((today-birthday).days/365.25)
print(birthday)
print(f'Name: {name}, Age: {age}.')
print(f"Birthday: {birthday:%A, %B %d, %Y}.")

2010-01-19
Name: Clément, Age: 12.
Birthday: Tuesday, January 19, 2010.


In [120]:
locale.setlocale(locale.LC_TIME, "fr_FR") 
print(f'Date de naissance: {birthday:%A %d %B %Y}.')

Date de naissance: Mardi 19 janvier 2010.


_Documentation supplémentaire:_
[Doc python 3](https://docs.python.org/3/reference/lexical_analysis.html#f-strings) et [PEP-498](https://www.python.org/dev/peps/pep-0498/).

### Dictionnaires `{}`

- collection **non-ordonnée**, **modifiable**
- collection **itérable** qui correspond à un tableau associatif, un **ensemble de couple (clé, valeur)**:
    - une clé **unique** _key_ de type: `int`, `float`, `string` ou tuples
    - une valeur _value_ de type quelconque

**Syntaxe:** accolades `{}` et des couples `key:value` séparés par des virgules `,`

Implémentation (algorithme interne): [table de hashage](https://en.wikipedia.org/wiki/Hash_table).

Dans le module `collections` on trouve d'autres dictionnaires:
- OrderedDict
- defaultdict

#### Création, manipulation

In [121]:
empty_dict = {}              # dictionnaire vide, ou bien dict()
type_planetes = {'terre': 'tellurique', 'mars':'tellurique', 'jupyter':'gazeuse'}
type_planetes = dict(terre='tellurique', mars='tellurique', jupyter='gazeuse')
type_planetes

{'terre': 'tellurique', 'mars': 'tellurique', 'jupyter': 'gazeuse'}

In [122]:
print(liste_methodes(type_planetes))

['clear', 'copy', 'fromkeys', 'get', 'items', 'keys', 'pop', 'popitem', 'setdefault', 'update', 'values']


In [123]:
type_planetes['terre']                    # renvoie la valeur correspondante 
type_planetes.get('terre', 'non trouvé')  # alternative qui fonctionne même si la clef n'est pas dans le dict

'tellurique'

In [124]:
print('mars' in type_planetes)    # appartenance pour les clés
print('tellurique' in type_planetes)   # pas pour les valeurs

True
False


In [125]:
type_planetes.items() # renvoie une vue (view) itérable, voir aussi keys() et values()

dict_items([('terre', 'tellurique'), ('mars', 'tellurique'), ('jupyter', 'gazeuse')])

In [126]:
for x in type_planetes.items():
    print(x)

('terre', 'tellurique')
('mars', 'tellurique')
('jupyter', 'gazeuse')


#### Modification

In [127]:
type_planetes['saturne'] = 'gazeuse'                         # ajout d'une entrée
type_planetes['terre'] = ['tellurique', 'avec atmosphère' ]  # modification
print(type_planetes)

{'terre': ['tellurique', 'avec atmosphère'], 'mars': 'tellurique', 'jupyter': 'gazeuse', 'saturne': 'gazeuse'}


In [128]:
print(type_planetes)

{'terre': ['tellurique', 'avec atmosphère'], 'mars': 'tellurique', 'jupyter': 'gazeuse', 'saturne': 'gazeuse'}


In [129]:
del type_planetes['mars']        # détruit l'entrée mars
type_planetes.pop('saturne')     # détruit et renvoie la valeur

'gazeuse'

In [130]:
type_planetes.update({'uranus':'gazeuse', 'neptune':'gazeuse'})
type_planetes

{'terre': ['tellurique', 'avec atmosphère'],
 'jupyter': 'gazeuse',
 'uranus': 'gazeuse',
 'neptune': 'gazeuse'}

#### Parcourir un dictionnaire

In [131]:
for key in type_planetes:
    print(key)

terre
jupyter
uranus
neptune


In [132]:
for key in type_planetes.keys():
    print(key)

terre
jupyter
uranus
neptune


In [133]:
for value in type_planetes.values():
    print(value)

['tellurique', 'avec atmosphère']
gazeuse
gazeuse
gazeuse


In [134]:
for key, value in type_planetes.items():
    print(key.capitalize(), ":", value)

Terre : ['tellurique', 'avec atmosphère']
Jupyter : gazeuse
Uranus : gazeuse
Neptune : gazeuse


### Ensembles `set`

- collection **hétérogène**: composée d'objets **distincts** de types quelconques 
- collection **non ordonnée**, **itérable**
- collection **modifiable**: la taille et le contenu peuvent changer

**Syntaxe:** mot-clé `set` (ou `{}`) et virgule qui sépare les éléments.

Implémentation (algorithme interne): [table de hashage](https://en.wikipedia.org/wiki/Hash_table).

Pour un ensemble **non modifiable** on peut utiliser le type **fronzenset**.

#### Création, opérations

In [135]:
ensemble_vide = set()                # seule syntaxe possible
lettres = set('bonjour')             # initialisation à partir d'une string  
print(lettres)

A = set([1, 2, 3, 4, 5, 6, 3, 2, 1]) # initialisation à partir d'une liste
print("A:", A)

{'u', 'o', 'r', 'b', 'j', 'n'}
A: {1, 2, 3, 4, 5, 6}


In [136]:
B = { 2, 3, 5, 7 }          # syntaxe possible sans le mot-clé set
B.add(11)
print("B:", B)

B: {2, 3, 5, 7, 11}


In [137]:
print("Intersection:\t", A & B)      
print("Union:\t\t", A | B)
print("Différence A\B:\t", A - B)
print("Différence B\A:\t", B - A)

Intersection:	 {2, 3, 5}
Union:		 {1, 2, 3, 4, 5, 6, 7, 11}
Différence A\B:	 {1, 4, 6}
Différence B\A:	 {11, 7}


#### Manipulation

In [138]:
print(liste_methodes(A))

['add', 'clear', 'copy', 'difference', 'difference_update', 'discard', 'intersection', 'intersection_update', 'isdisjoint', 'issubset', 'issuperset', 'pop', 'remove', 'symmetric_difference', 'symmetric_difference_update', 'union', 'update']


In [139]:
A.update(lettres)          # ajout des éléments de lettres dans A
print(A)
A.difference_update(B)     # on supprime les éléments B de A
print(A)

{1, 2, 3, 4, 5, 6, 'u', 'o', 'r', 'b', 'j', 'n'}
{1, 4, 6, 'u', 'o', 'r', 'b', 'j', 'n'}


In [140]:
B.issubset(A)             

False

In [141]:
B.isdisjoint(A)

True

In [142]:
if not A & B: 
    print("Intersection vide !")

Intersection vide !


## Compléments

### `*args` et `**kwargs`

__Opérateurs__ `*` __et__ `**`: permettent d'exploser (unpacking) une liste ou un dictionnaire

In [143]:
l = [1, 6]
g(*l)        # appels possibles: g(*l, t=0.2) ou g(t=0.2, *l)
## ici c'est l'appel de g(1, 6, 0.5) car t a une valeur par defaut

3.5

In [144]:
d = {'a':1, 'b':6}
g(**d)       # même chose avec un dict

3.5

__Utilisation de__ `*` __et__ `**` __dans les arguments d'une fonction__: permet de regrouper 
- des arguments non-nommés (dans une liste avec `*`, par convention appelée `*args`)
- des arguments nommés (dans un dictionnaire avec `**`, par conversion `**kwargs`)

Très utilisé dans le module `matplotlib`: à connaitre pour bien comprendre la documentation.

__Exemple d'utilisation de__ `*args`:

In [145]:
def gl(*args, t=0.5):
    if len(args) == 2:
        return args[0] + t*(args[1] - args[0])
    else: 
        print('Il faut 2 arguments')

In [146]:
gl(1, 6, t=0.2)        # attention l'appel gl(1, 6, 0.2) est invalide !

2.0

__Exemple d'utilisation de__ `**kwargs`:

In [147]:
def gd(**kwargs):
    if len(kwargs) == 3:
        return kwargs['a'] + kwargs['t']*(kwargs['b'] - kwargs['a'])
    else: 
        print('Il faut 3 arguments')

In [148]:
gd(a=1, b=6, t=0.2)    # appel gd(1, 6, t=0.2) invalide

2.0

### Documentation

- [Tutoriel officiel](https://docs.python.org/fr/3/tutorial/index.html#tutorial-index)
- [Documentation officielle](https://docs.python.org/fr/3/reference/index.html)
- [Wiki avec des ressources](https://wiki.python.org)
- [geeksforgeeks](https://www.geeksforgeeks.org/python-programming-language/)
- [stackoverflow](https://stackoverflow.com/) pour poser des questions / lire les réponses