webentwicklung-frage-antwort-db.com.de

wie man ein iterierbares Stück in gleichgroße Stücke aufteilt

Mögliches Duplizieren:
Wie teilt man in Python eine Liste in gleich große Brocken auf?

Ich bin überrascht, dass ich keine "Batch" -Funktion finden konnte, die als Eingabe eine iterierbare Eingabe und eine iterierbare Ausgabe von iterierbaren Daten annehmen würde.

Zum Beispiel:

for i in batch(range(0,10), 1): print i
[0]
[1]
...
[9]

oder:

for i in batch(range(0,10), 3): print i
[0,1,2]
[3,4,5]
[6,7,8]
[9]

Nun schrieb ich, was ich für einen ziemlich einfachen Generator hielt:

def batch(iterable, n = 1):
   current_batch = []
   for item in iterable:
       current_batch.append(item)
       if len(current_batch) == n:
           yield current_batch
           current_batch = []
   if current_batch:
       yield current_batch

Aber das oben genannte gibt mir nicht das, was ich erwartet hätte:

for x in   batch(range(0,10),3): print x
[0]
[0, 1]
[0, 1, 2]
[3]
[3, 4]
[3, 4, 5]
[6]
[6, 7]
[6, 7, 8]
[9]

Ich habe also etwas verpasst und dies zeigt wahrscheinlich mein völliges Unverständnis für Python-Generatoren. Jemand möchte mich in die richtige Richtung weisen?

[Edit: Ich habe schließlich festgestellt, dass das obige Verhalten nur dann auftritt, wenn ich dies in ipython und nicht in Python selbst ausführte.]

55
mathieu

Dies ist wahrscheinlich effizienter (schneller)

def batch(iterable, n=1):
    l = len(iterable)
    for ndx in range(0, l, n):
        yield iterable[ndx:min(ndx + n, l)]

for x in batch(range(0, 10), 3):
    print x

Es vermeidet das Erstellen neuer Listen.

71
Carl F.

FWIW, die -Rezepte im itertools-Modul liefert folgendes Beispiel:

def grouper(n, iterable, fillvalue=None):
    "grouper(3, 'ABCDEFG', 'x') --> ABC DEF Gxx"
    args = [iter(iterable)] * n
    return izip_longest(fillvalue=fillvalue, *args)

Es funktioniert so:

>>> list(grouper(3, range(10)))
[(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, None, None)]
30

Wie andere bereits bemerkt haben, entspricht der von Ihnen angegebene Code genau dem, was Sie möchten. Für einen anderen Ansatz mit itertools.islice könnten Sie ein Beispiel des folgenden Rezepts sehen:

from itertools import islice, chain

def batch(iterable, size):
    sourceiter = iter(iterable)
    while True:
        batchiter = islice(sourceiter, size)
        yield chain([batchiter.next()], batchiter)
25
donkopotamus

Seltsam, scheint in Python 2.x gut für mich zu funktionieren

>>> def batch(iterable, n = 1):
...    current_batch = []
...    for item in iterable:
...        current_batch.append(item)
...        if len(current_batch) == n:
...            yield current_batch
...            current_batch = []
...    if current_batch:
...        yield current_batch
...
>>> for x in batch(range(0, 10), 3):
...     print x
...
[0, 1, 2]
[3, 4, 5]
[6, 7, 8]
[9]
6
John Doe

Ich habe nur eine Antwort gegeben. Jetzt bin ich jedoch der Meinung, dass die beste Lösung darin besteht, keine neuen Funktionen zu schreiben. More-itertools enthält viele zusätzliche Tools und chunked ist unter ihnen.

1
Yongwei Wu

Dies ist ein sehr kurzer Codeausschnitt, den ich kenne (nicht meine Erstellung), der len nicht verwendet und der unter Python 2 und 3 (nicht meine Erstellung) funktioniert:

def chunks(iterable, size):
    from itertools import chain, islice
    iterator = iter(iterable)
    for first in iterator:
        yield list(chain([first], islice(iterator, size - 1)))
0
Yongwei Wu
def batch(iterable, n):
    iterable=iter(iterable)
    while True:
        chunk=[]
        for i in range(n):
            try:
                chunk.append(next(iterable))
            except StopIteration:
                yield chunk
                return
        yield chunk

list(batch(range(10), 3))
[[0, 1, 2], [3, 4, 5], [6, 7, 8], [9]]
0
Atila Romero

Dies würde für jedes Iterable funktionieren. 

from itertools import Zip_longest, filterfalse

def batch_iterable(iterable, batch_size=2): 
    args = [iter(iterable)] * batch_size 
    return (Tuple(filterfalse(lambda x: x is None, group)) for group in Zip_longest(fillvalue=None, *args))

Es würde so funktionieren:

>>>list(batch_iterable(range(0,5)), 2)
[(0, 1), (2, 3), (4,)]

PS: Es würde nicht funktionieren, wenn iterable None-Werte hat.

0
Trideep Rath

Das ist was ich in meinem Projekt verwende. Es verarbeitet Iterables oder Listen so effizient wie möglich.

def chunker(iterable, size):
    if not hasattr(iterable, "__len__"):
        # generators don't have len, so fall back to slower
        # method that works with generators
        for chunk in chunker_gen(iterable, size):
            yield chunk
        return

    it = iter(iterable)
    for i in range(0, len(iterable), size):
        yield [k for k in islice(it, size)]


def chunker_gen(generator, size):
    iterator = iter(generator)
    for first in iterator:

        def chunk():
            yield first
            for more in islice(iterator, size - 1):
                yield more

        yield [k for k in chunk()]
0
Josh Smeaton

Hier ist ein Ansatz, der die reduce-Funktion verwendet.

Einzeiler:

from functools import reduce
reduce(lambda cumulator,item: cumulator[-1].append(item) or cumulator if len(cumulator[-1]) < batch_size else cumulator + [[item]], input_array, [[]])

Oder besser lesbare Version:

from functools import reduce
def batch(input_list, batch_size):
  def reducer(cumulator, item):
    if len(cumulator[-1]) < batch_size:
      cumulator[-1].append(item)
      return cumulator
    else:
      cumulator.append([item])
    return cumulator
  return reduce(reducer, input_list, [[]])

Prüfung:

>>> batch([1,2,3,4,5,6,7], 3)
[[1, 2, 3], [4, 5, 6], [7]]
>>> batch(a, 8)
[[1, 2, 3, 4, 5, 6, 7]]
>>> batch([1,2,3,None,4], 3)
[[1, 2, 3], [None, 4]]
0
Lycha