7.2 迭代器模式
迭代器模式(特别是在ECMAScript这个语境下)描述了一个方案,即可以把有些结构称为“可迭代对象”(iterable),因为它们实现了正式的Iterable接口,而且可以通过迭代器Iterator消费。
可迭代对象是一种抽象的说法。基本上,可以把可迭代对象理解成数组或集合这样的集合类型的对象。它们包含的元素都是有限的,而且都具有无歧义的遍历顺序:
// 数组的元素是有限的 // 递增索引可以按序访问每个元素 let arr = [3, 1, 4]; // 集合的元素是有限的 // 可以按插入顺序访问每个元素 let set = new Set().add(3).add(1).add(4);
不过,可迭代对象不一定是集合对象,也可以是仅仅具有类似数组行为的其他数据结构,比如本章开头提到的计数循环。该循环中生成的值是暂时性的,但循环本身是在执行迭代。计数循环和数组都具有可迭代对象的行为。
注意 临时性可迭代对象可以实现为生成器,本章后面会讨论。
任何实现Iterable接口的数据结构都可以被实现Iterator接口的结构“消费”(consume)。迭代器(iterator)是按需创建的一次性对象。每个迭代器都会关联一个可迭代对象,而迭代器会暴露迭代其关联可迭代对象的API。迭代器无须了解与其关联的可迭代对象的结构,只需要知道如何取得连续的值。这种概念上的分离正是Iterable和Iterator的强大之处。
7.2.1 可迭代协议
实现Iterable接口(可迭代协议)要求同时具备两种能力:支持迭代的自我识别能力和创建实现Iterator接口的对象的能力。在ECMAScript中,这意味着必须暴露一个属性作为“默认迭代器”,而且这个属性必须使用特殊的Symbol.iterator作为键。这个默认迭代器属性必须引用一个迭代器工厂函数,调用这个工厂函数必须返回一个新迭代器。
很多内置类型都实现了Iterable接口:
❑ 字符串
❑ 数组
❑ 映射
❑ 集合
❑ arguments对象
❑ NodeList等DOM集合类型
检查是否存在默认迭代器属性可以暴露这个工厂函数:
let num = 1; let obj = {}; // 这两种类型没有实现迭代器工厂函数 console.log(num[Symbol.iterator]); // undefined console.log(obj[Symbol.iterator]); // undefined let str = 'abc'; let arr = ['a', 'b', 'c']; let map = new Map().set('a', 1).set('b', 2).set('c', 3); let set = new Set().add('a').add('b').add('c'); let els = document.querySelectorAll('div'); // 这些类型都实现了迭代器工厂函数 console.log(str[Symbol.iterator]); // f values() { [native code] } console.log(arr[Symbol.iterator]); // f values() { [native code] } console.log(map[Symbol.iterator]); // f values() { [native code] } console.log(set[Symbol.iterator]); // f values() { [native code] } console.log(els[Symbol.iterator]); // f values() { [native code] } // 调用这个工厂函数会生成一个迭代器 console.log(str[Symbol.iterator]()); // StringIterator {} console.log(arr[Symbol.iterator]()); // ArrayIterator {} console.log(map[Symbol.iterator]()); // MapIterator {} console.log(set[Symbol.iterator]()); // SetIterator {} console.log(els[Symbol.iterator]()); // ArrayIterator {}
实际写代码过程中,不需要显式调用这个工厂函数来生成迭代器。实现可迭代协议的所有类型都会自动兼容接收可迭代对象的任何语言特性。接收可迭代对象的原生语言特性包括:
❑ for-of循环
❑ 数组解构
❑ 扩展操作符
❑ Array.from()
❑ 创建集合
❑ 创建映射
❑ Promise.all()接收由期约组成的可迭代对象
❑ Promise.race()接收由期约组成的可迭代对象
❑ yield*操作符,在生成器中使用
这些原生语言结构会在后台调用提供的可迭代对象的这个工厂函数,从而创建一个迭代器:
let arr = ['foo', 'bar', 'baz']; // for-of循环 for (let el of arr) { console.log(el); } // foo // bar // baz // 数组解构 let [a, b, c] = arr; console.log(a, b, c); // foo, bar, baz // 扩展操作符 let arr2 = [...arr]; console.log(arr2); // ['foo', 'bar', 'baz'] // Array.from() let arr3 = Array.from(arr); console.log(arr3); // ['foo', 'bar', 'baz'] // Set构造函数 let set = new Set(arr); console.log(set); // Set(3) {'foo', 'bar', 'baz'} // Map构造函数 let pairs = arr.map((x, i) => [x, i]); console.log(pairs); // [['foo', 0], ['bar', 1], ['baz', 2]] let map = new Map(pairs); console.log(map); // Map(3) { 'foo'=>0, 'bar'=>1, 'baz'=>2 }
如果对象原型链上的父类实现了Iterable接口,那这个对象也就实现了这个接口:
class FooArray extends Array {} let fooArr = new FooArray('foo', 'bar', 'baz'); for (let el of fooArr) { console.log(el); } // foo // bar // baz
7.2.2 迭代器协议
迭代器是一种一次性使用的对象,用于迭代与其关联的可迭代对象。迭代器API使用next()方法在可迭代对象中遍历数据。每次成功调用next(),都会返回一个IteratorResult对象,其中包含迭代器返回的下一个值。若不调用next(),则无法知道迭代器的当前位置。
next()方法返回的迭代器对象IteratorResult包含两个属性:done和value。done是一个布尔值,表示是否还可以再次调用next()取得下一个值;value包含可迭代对象的下一个值(done为false),或者undefined(done为true)。done: true状态称为“耗尽”。可以通过以下简单的数组来演示:
// 可迭代对象 let arr = ['foo', 'bar']; // 迭代器工厂函数 console.log(arr[Symbol.iterator]); // f values() { [native code] } // 迭代器 let iter = arr[Symbol.iterator](); console.log(iter); // ArrayIterator {} // 执行迭代 console.log(iter.next()); // { done: false, value: 'foo' } console.log(iter.next()); // { done: false, value: 'bar' } console.log(iter.next()); // { done: true, value: undefined }
这里通过创建迭代器并调用next()方法按顺序迭代了数组,直至不再产生新值。迭代器并不知道怎么从可迭代对象中取得下一个值,也不知道可迭代对象有多大。只要迭代器到达done: true状态,后续调用next()就一直返回同样的值了:
let arr = ['foo']; let iter = arr[Symbol.iterator](); console.log(iter.next()); // { done: false, value: 'foo' } console.log(iter.next()); // { done: true, value: undefined } console.log(iter.next()); // { done: true, value: undefined } console.log(iter.next()); // { done: true, value: undefined }
每个迭代器都表示对可迭代对象的一次性有序遍历。不同迭代器的实例相互之间没有联系,只会独立地遍历可迭代对象:
let arr = ['foo', 'bar']; let iter1 = arr[Symbol.iterator](); let iter2 = arr[Symbol.iterator](); console.log(iter1.next()); // { done: false, value: 'foo' } console.log(iter2.next()); // { done: false, value: 'foo' } console.log(iter2.next()); // { done: false, value: 'bar' } console.log(iter1.next()); // { done: false, value: 'bar' }
迭代器并不与可迭代对象某个时刻的快照绑定,而仅仅是使用游标来记录遍历可迭代对象的历程。如果可迭代对象在迭代期间被修改了,那么迭代器也会反映相应的变化:
let arr = ['foo', 'baz']; let iter = arr[Symbol.iterator](); console.log(iter.next()); // { done: false, value: 'foo' } // 在数组中间插入值 arr.splice(1, 0, 'bar'); console.log(iter.next());//{done: false, value: 'bar'} console.log(iter.next()); // { done: false, value: 'baz' } console.log(iter.next()); // { done: true, value: undefined }
注意 迭代器维护着一个指向可迭代对象的引用,因此迭代器会阻止垃圾回收程序回收可迭代对象。
“迭代器”的概念有时候容易模糊,因为它可以指通用的迭代,也可以指接口,还可以指正式的迭代器类型。下面的例子比较了一个显式的迭代器实现和一个原生的迭代器实现。
// 这个类实现了可迭代接口(Iterable) // 调用默认的迭代器工厂函数会返回 // 一个实现迭代器接口(Iterator)的迭代器对象 class Foo { [Symbol.iterator]() { return { next() { return { done: false, value: 'foo' }; } } } } let f = new Foo(); // 打印出实现了迭代器接口的对象 console.log(f[Symbol.iterator]()); // { next: f() {} } // Array类型实现了可迭代接口(Iterable) // 调用Array类型的默认迭代器工厂函数 // 会创建一个ArrayIterator的实例 let a = new Array(); // 打印出ArrayIterator的实例 console.log(a[Symbol.iterator]()); // Array Iterator {}
7.2.3 自定义迭代器
与Iterable接口类似,任何实现Iterator接口的对象都可以作为迭代器使用。下面这个例子中的Counter类只能被迭代一定的次数:
class Counter { // Counter的实例应该迭代limit次 constructor(limit) { this.count = 1; this.limit = limit; } next() { if (this.count <= this.limit) { return { done: false, value: this.count++ }; } else { return { done: true, value: undefined }; } } [Symbol.iterator]() { return this; } } let counter = new Counter(3); for (let i of counter) { console.log(i); } // 1 // 2 // 3
这个类实现了Iterator接口,但不理想。这是因为它的每个实例只能被迭代一次:
for (let i of counter) { console.log(i); } // 1 // 2 // 3 for (let i of counter) { console.log(i); } // (nothing logged)
为了让一个可迭代对象能够创建多个迭代器,必须每创建一个迭代器就对应一个新计数器。为此,可以把计数器变量放到闭包里,然后通过闭包返回迭代器:
class Counter { constructor(limit) { this.limit = limit; } [Symbol.iterator]() { letcount=1, limit=this.limit; return{ next(){ if(count<=limit){ return{done: false, value: count++}; }else{ return{done: true, value: undefined}; } } }; } } let counter = new Counter(3); for (let i of counter) { console.log(i); } // 1 // 2 // 3 for (let i of counter) { console.log(i); } // 1 // 2 // 3
每个以这种方式创建的迭代器也实现了Iterable接口。Symbol.iterator属性引用的工厂函数会返回相同的迭代器:
let arr = ['foo', 'bar', 'baz']; let iter1 = arr[Symbol.iterator](); console.log(iter1[Symbol.iterator]); // f values() { [native code] } let iter2 = iter1[Symbol.iterator](); console.log(iter1===iter2); //true
因为每个迭代器也实现了Iterable接口,所以它们可以用在任何期待可迭代对象的地方,比如for-of循环:
let arr = [3, 1, 4]; let iter = arr[Symbol.iterator](); for (let item of arr) { console.log(item); } // 3 // 1 // 4 for (let item of iter) { console.log(item); } // 3 // 1 // 4
7.2.4 提前终止迭代器
可选的return()方法用于指定在迭代器提前关闭时执行的逻辑。执行迭代的结构在想让迭代器知道它不想遍历到可迭代对象耗尽时,就可以“关闭”迭代器。可能的情况包括:
❑ for-of循环通过break、continue、return或throw提前退出;
❑ 解构操作并未消费所有值。
return()方法必须返回一个有效的IteratorResult对象。简单情况下,可以只返回{ done: true }。因为这个返回值只会用在生成器的上下文中,所以本章后面再讨论这种情况。
如下面的代码所示,内置语言结构在发现还有更多值可以迭代,但不会消费这些值时,会自动调用return()方法。
class Counter { constructor(limit) { this.limit = limit; } [Symbol.iterator]() { let count = 1, limit = this.limit; return { next() { if (count <= limit) { return { done: false, value: count++ }; } else { return { done: true }; } }, return(){ console.log('Exitingearly'); return{done: true}; } }; } } let counter1 = new Counter(5); for(letiofcounter1){ if(i>2){ break; } console.log(i); } //1 //2 //Exitingearly let counter2 = new Counter(5); try { for (let i of counter2) { if (i > 2) { throw'err'; } console.log(i); } } catch(e) {} // 1 // 2 //Exitingearly let counter3 = new Counter(5); let[a, b]=counter3; //Exitingearly
如果迭代器没有关闭,则还可以继续从上次离开的地方继续迭代。比如,数组的迭代器就是不能关闭的:
let a = [1, 2, 3, 4, 5]; let iter = a[Symbol.iterator](); for (let i of iter) { console.log(i); if (i > 2) { break } } // 1 // 2 // 3 for (let i of iter) { console.log(i); } // 4 // 5
因为return()方法是可选的,所以并非所有迭代器都是可关闭的。要知道某个迭代器是否可关闭,可以测试这个迭代器实例的return属性是不是函数对象。不过,仅仅给一个不可关闭的迭代器增加这个方法并不能让它变成可关闭的。这是因为调用return()不会强制迭代器进入关闭状态。即便如此,return()方法还是会被调用。
let a = [1, 2, 3, 4, 5]; let iter = a[Symbol.iterator](); iter.return=function(){ console.log('Exitingearly'); return{done: true}; }; for (let i of iter) { console.log(i); if (i > 2) { break } } // 1 // 2 // 3 //提前退出 for (let i of iter) { console.log(i); } // 4 // 5