ListDistinct详解

发布时间:2023-05-20

一、ListDistinct是什么

ListDistinct是对IEnumerable实例去除重复元素的扩展方法,它返回一个IEnumerable。

public static IEnumerable<TSource> ListDistinct<TSource>(this IEnumerable<TSource> source)
{
    return source.Distinct();
}

我们可以看到,ListDistinct方法实际上是对Linq中的Distinct方法进行了一次封装,使得使用更加方便。

二、ListDistinct的使用方法

ListDistinct方法非常简单,只需要使用.运算符即可使用。

List<int> numbers = new List<int> { 1, 2, 3, 4, 4, 5 };
IEnumerable<int> distinctNumbers = numbers.ListDistinct();
foreach (var number in distinctNumbers)
{
    Console.WriteLine(number);
}

以上代码将输出以下结果:

1
2
3
4
5

我们还可以使用Lambda表达式对元素进行筛选:

List<string> names = new List<string> { "Bob", "Mary", "Bob", "John" };
IEnumerable<string> distinctNames = names.ListDistinct(name => name.Length < 4);
foreach(var name in distinctNames)
{
    Console.WriteLine(name);
}

以上代码将输出以下结果:

Bob
Mary

三、ListDistinct使用的注意事项

1、类型一致性问题

ListDistinct方法返回的是IEnumerable,而不是List。因此,在使用ListDistinct方法之后,无法像List一样直接执行Add等方法,需要将IEnumerable转换为List后再进行操作。

List<int> numbers = new List<int> { 1, 2, 3, 4, 4, 5 };
IEnumerable<int> distinctNumbers = numbers.ListDistinct();
List<int> distinctNumbersList = distinctNumbers.ToList();

2、性能问题

虽然ListDistinct方法使去重变得非常简单,但是它的性能可能不如手写的去重算法,在处理大数据量时需要注意。

Stopwatch sw = new Stopwatch();
sw.Start();
List<int> numbers = new List<int>();
for(int i = 0; i < 1000000; i++)
{
    numbers.Add(i % 10);
}
IEnumerable<int> distinctNumbers = numbers.ListDistinct();
foreach(var number in distinctNumbers)
{
    Console.Write(number);
}
sw.Stop();
Console.WriteLine(sw.ElapsedMilliseconds);

以上代码大概需要40ms左右。

Stopwatch sw2 = new Stopwatch();
sw2.Start();
List<int> numbers2 = new List<int>();
for (int i = 0; i < 1000000; i++)
{
    if (!numbers2.Contains(i % 10))
    {
        numbers2.Add(i % 10);
    }
}
foreach(var number in numbers2)
{
    Console.Write(number);
}
sw2.Stop();
Console.WriteLine(sw2.ElapsedMilliseconds);

而以上手写的去重算法,只需要大概5ms。

四、对比Distinct方法

我们来看一下Distinct方法的使用:

List<int> numbers = new List<int> { 1, 2, 3, 4, 4, 5 };
IEnumerable<int> distinctNumbers = numbers.Distinct();
foreach (var number in distinctNumbers)
{
    Console.WriteLine(number);
}

输出结果和使用ListDistinct是相同的。 从性能上来看,手写算法仍然是最优的。但是在需要方便、简单快捷的情况下,ListDistinct方法仍然是个不错的选择。

五、总结

ListDistinct方法是一种非常方便的去重方法,使用方法非常简单,但在处理大数据量时需要注意性能问题。同时,我们还可以对元素进行筛选。在使用ListDistinct方法时,需要注意类型一致性问题。