在C#中选择正确的集合进行编码 📅 2026/7/5 13:30:27 要选择正确的集合我们首先要了解一些数据结构的知识。所谓数据结构就是相互之间存在一种或多种特定关系的数据元素的集合。结合下图我们看一下对集合的分类。集合分类在上图中可以看到集合总体上分为线性集合和非线性集合。线性集合指元素具有唯一的前驱和后驱的数据结构类型。非线性集合是指具有多个前驱或后驱的数据结构类型如树、图。在FCL中非线性集合实现的比较少所以我们将会更多的讨论线性集合。注意由于类型安全、转型效率等方面的原因本建议将只讨论泛型集合。线性集合按存储方式又分为直接存储和顺序存储。所谓直接存储是指该类型的集合数据元素可以直接通过下标也即index来访问在C#中有三种形式Array包括数组和ListTstringstruct。直接存储结构的优点是向数据结构中添加元素是很高效的只要直接放在数据末尾的第一个空位上就可以了。它的缺点是向集合插入元素将会变得低效它需要给插入的元素腾出位置并顺序移动后面的元素。string和structs虽然是直接存储结构但它们与一般的集合定义有很大的不同所以也不在本建议讨论之中。在直接存储的数据结构中需要区分的是数组和ListT的选择。再次强调一下如果集合的数目固定并且不涉及到转型使用数组效率高否则就使用ListT。顺序存储结构也即线性表。线性表的大小可动态的扩大和缩小它在一片连续的区域中存储数据元素。线性表不能按照索引进行查找它通过对地址的引用来搜索元素为了找到某个元素它必须遍历所有元素直到找到对应的元素为止。所以线性表的优点是插入和删除数据效率高而缺点是查找的效率相对来说低一些。线性表又可以分为队列、栈以及索引群集在C#中分别表现为QueueTStackT索引群集又进一步泛化为字典类型Dictionary TKey, TValue 和双向链表LinkedListT。队列QueueT遵循的是先入先出模式它在集合末尾添加元素在集合起始删除元素如图队列操作根据队列的特点可以用来处理并发命令等场景将所有客户端的命令先入队由专门的工作线程来执行队列的命令。在分布式中的消息队列就是一个典型的队列应用实例。栈StackT遵循的是后入先出模式它在集合末尾添加元素同时也在集合末尾删除元素如图2-3栈操作字典DictionaryTKey, TValue存储的是键值对值在基于键的散列码的基础上进行存储。字典类对象由包含集合元素的存储桶组成每一存储桶与基于该元素的键的哈希值关联。如果需要根据键进行值的查找使用DictionaryTKey, TValue将会使搜索和检索更会快捷。双向链表LinkedListT是一个类型为LinkedListNode的元素对象的集合。当我们在集合中觉得插入和删除数据很慢的时候我们可以考虑使用链表。如果我们使用LinkedListT我们会发现此类型并没有其它集合普遍具有的Add方法取而代之的是AddAfter、AddBefore、AddFirst、AddLast等方法。双向链表中的每个节点都向前指向Previous节点向后指向Next节点。以上讨论了线性集合在FCL中非线性集合实现的不多。非线性集合分为层次集合和组集合。层次集合如树在FCL中就没有实现。组集合又分为集和图。集在FCL中实现为HashSetT而图在FCL中也没有对应实现。集的概念在本意上是指存放在集合中的元素是无序的且不能重复的。下图演示了集的用途集操作除了上面我们提到的集合类型还有其他几个要掌握的集合类型它们是在实际应用中发展出来的对以上基础类型的扩展SortedListTSortedDictionaryTKey, TValueSortedSetT。它们所扩展的对应类为ListTDictionaryTKey,TValueHashSetT作用是将原本无序排列的元素变为有序排列。除了排序上的需求增加了上面3个集合类在命名空间System.Collections.Concurrent下还涉及几个多线程集合类。它们主要是ConcurrentBagT对应ListTConcurrentDictionaryTKey, TValue对应DictionaryTKey, TValueConcurrentQueueT对应QueueTConcurrentStackT对应StackT。如果我们的集合被用于多线程应用中可以使用这几个集合类型。关于集合的线程安全性可以进一步查看MSDN。本建议到此为止已经介绍了FCL中的大部分泛型集合类为了对它们有更好的了解最后我们给出一个主要集合类的类图。实际工作中应该根据需要选择合适的集合类。FCL集合类图