排序系列

前言

大家好，我是老马。

以前从工程的角度，已经梳理过一次排序算法。

这里从力扣算法的角度，重新梳理一遍。

核心内容包含：

1）常见排序算法介绍

2）背后的核心思想

3）leetcode 经典题目练习+讲解

4）应用场景、优缺点等对比总结

5）工程 sdk 包，这个已经完成。

6) 可视化

451. 根据字符出现频率排序

给定一个字符串 s ，根据字符出现的频率对其进行降序排序。一个字符出现的频率是它出现在字符串中的次数。

返回已排序的字符串。如果有多个答案，返回其中任何一个。

示例 1:

输入: s = “tree” 输出: “eert” 解释: ‘e’出现两次，’r’和’t’都只出现一次。因此’e’必须出现在’r’和’t’之前。此外，”eetr”也是一个有效的答案。

示例 2:

输入: s = “cccaaa” 输出: “cccaaa” 解释: ‘c’和’a’都出现三次。此外，”aaaccc”也是有效的答案。注意”cacaca”是不正确的，因为相同的字母必须放在一起。

示例 3:

输入: s = “Aabb” 输出: “bbAa” 解释: 此外，”bbaA”也是一个有效的答案，但”Aabb”是不正确的。注意’A’和’a’被认为是两种不同的字符。

提示:

1 <= s.length <= 5 * 10s^5

s 由大小写英文字母和数字组成

v1-HashMap 版本

思路

通过 hashMap 记录次数

但是次数的话，无法关联到对应的 char，所以们额外加一个 HashMap 记录次数和对应的 char 列表的关系。

实现

    public String frequencySort(String s) {
        if(s.length() <= 1) {
            return s;
        }

        Map<Character, Integer> freqCountMap = new HashMap<>();

        char[] chars = s.toCharArray();
        for(char c : chars) {
            Integer count = freqCountMap.getOrDefault(c, 0);
            freqCountMap.put(c, ++count);
        }

        // 怎么按照次数排序呢？
        Map<Integer, List<Character>> countCharsMap = new HashMap<>();
        for(Map.Entry<Character, Integer> entry : freqCountMap.entrySet()) {
            List<Character> characterList = countCharsMap.getOrDefault(entry.getValue(), new ArrayList<>());
            characterList.add(entry.getKey());

            countCharsMap.put(entry.getValue(), characterList);
        }

        // 整体数排序
        List<Integer> countList = new ArrayList<>(countCharsMap.keySet());
        Collections.sort(countList, new Comparator<Integer>() {
            @Override
            public int compare(Integer o1, Integer o2) {
                // 是否写反了？
                return o2.compareTo(o1);
            }
        });


        // 处理
        StringBuffer stringBuffer = new StringBuffer();
        for(Integer count : countList) {
            List<Character> characterList = countCharsMap.get(count);

            // 总数？
            for(Character c : characterList) {
                for(int i = 0; i < count; i++) {
                    stringBuffer.append(c);
                }
            }
        }

        return stringBuffer.toString();
    }

效果

18ms 击败 38.74%

just soso~

如何改进呢？

v2-对象替代 map

思路

如果你觉得用两个 map 不自然，也可以引入一个对象。

整体思路类似。

实现

    private class Node {
        private Character character;
        private int count;

        public Node(Character character, int count) {
            this.character = character;
            this.count = count;
        }
    }

    public String frequencySort(String s) {
        if (s.length() <= 1) {
            return s;
        }

        Map<Character, Integer> freqCountMap = new HashMap<>();
        char[] chars = s.toCharArray();
        for (char c : chars) {
            Integer count = freqCountMap.getOrDefault(c, 0);
            freqCountMap.put(c, ++count);
        }

        // 怎么按照次数排序呢？
        // 排序和大小堆的复杂度都是 OlogN()
        List<Node> nodeList = new ArrayList<>();
        for (Map.Entry<Character, Integer> entry : freqCountMap.entrySet()) {
            Node node = new Node(entry.getKey(), entry.getValue());
            nodeList.add(node);
        }
        Collections.sort(nodeList, new Comparator<Node>() {
            @Override
            public int compare(Node o1, Node o2) {
                return o2.count - o1.count;
            }
        });

        // 处理
        StringBuffer stringBuffer = new StringBuffer();
        for (Node node : nodeList) {
            for (int i = 0; i < node.count; i++) {
                stringBuffer.append(node.character);
            }
        }

        return stringBuffer.toString();
    }

效果

17ms 击败 43.61%

v3-桶排序版本

思路

频率有上限，所以我们用频率作为桶来分割。

如果有一个针对的用例，这个算法就G了。

个人理解这个，优化的核心应该是空间换时间。

通过超长的 bucket 桶，避免了排序的耗时。

我们直接在 v1 的基础上修改一下。

核心三步走：

1）计数排序统计次数

2）桶排序用次数作为下标，对应的 chars 作为 value，避免排序

3）从桶的后往前拼接结果

实现

    public static String frequencySort(String s) {
        if (s.length() <= 1) {
            return s;
        }

        // 数字是字母和数字，可以用技术来直接统计
        int[] counts = new int[128];
        char[] chars = s.toCharArray();
        for(char c : chars) {
            counts[c]++;
        }

        // 然后我们用桶排序的思想，来避免排序
        // 如果想节省空间，可以再一次遍历，找到最大的 freq
        // 可以对比一下二者的区别
        // 为什么+1？
        List<Character>[] charsList = new List[s.length()+1];
        for(int i = 0; i < counts.length; i++) {
            char c = (char) i;
            int freq = counts[i];

            //  直接根据次数频率，设置到对应的数组上
            List<Character> characters = charsList[freq];
            if(characters == null) {
                characters = new ArrayList<>();
            }

            characters.add(c);

            //直接根据次数设置，避免排序
            charsList[freq]= characters;
        }


        // 从后往前，直接拼接
        StringBuffer stringBuffer = new StringBuffer();
        for(int i = charsList.length-1; i >=0 ; i--) {
            List<Character> characters = charsList[i];
            if(characters != null) {
                // 拼接
                for(Character c : characters) {
                    for(int j = 0; j < i; j++) {
                        stringBuffer.append(c);
                    }
                }
            }
        }
        return stringBuffer.toString();
    }

效果

12ms 击败 81.14%

看的出来，不排序优势很大。

优化思路

我们尝试一下，把频率的最大限制加一下

因为只需要一个额外的 O(n)，看看效果如何。

实现

    public static String frequencySort(String s) {
        if (s.length() <= 1) {
            return s;
        }

        // 数字是字母和数字，可以用技术来直接统计
        int maxFreq = 0;
        int[] counts = new int[128];
        char[] chars = s.toCharArray();
        for(char c : chars) {
            counts[c]++;

            maxFreq = Math.max(maxFreq, counts[c]);
        }

        // 然后我们用桶排序的思想，来避免排序
        // 如果想节省空间，可以再一次遍历，找到最大的 freq
        // 可以对比一下二者的区别
        // 为什么+1？  freq 代表的是次数，比下标会多1.如果全部相同的话。
        List<Character>[] charsList = new List[maxFreq+1];
        for(int i = 0; i < counts.length; i++) {
            char c = (char) i;
            int freq = counts[i];

            //  直接根据次数频率，设置到对应的数组上
            List<Character> characters = charsList[freq];
            if(characters == null) {
                characters = new ArrayList<>();
            }

            characters.add(c);

            //直接根据次数设置，避免排序
            charsList[freq]= characters;
        }


        // 从后往前，直接拼接
        StringBuffer stringBuffer = new StringBuffer();
        for(int i = charsList.length-1; i >=0 ; i--) {
            List<Character> characters = charsList[i];
            if(characters != null) {
                // 拼接
                for(Character c : characters) {
                    for(int j = 0; j < i; j++) {
                        stringBuffer.append(c);
                    }
                }
            }
        }
        return stringBuffer.toString();
    }

效果

10ms 击败 86.41%

但是依然不是最快，为什么？

v4-最快的方法

思路

我们还是来学习一下目前的最优解法

优化思路：

1）尽量使用原生类型

2）因为 chars 只有 128 种，实际上是 26+26+10=62 种。

其实可以不用桶排序，直接循环一遍找最大次数就行。

3) 我们用 chars 数组，自己处理字符串的拼接

实现

    public String frequencySort(String s) {
        if (s.length() <= 1) {
            return s;
        }

        // 数字是字母和数字，可以用技术来直接统计
        int[] counts = new int[128];
        char[] chars = s.toCharArray();
        for (char c : chars) {
            counts[c]++;
        }

        // 结果 模拟实现 stringBuilder
        int index = 0;
        char[] results = new char[s.length()];

        // 直接拼接
        while (index < s.length()) {
            // 找到最大的 c + 次数
            char c = 0;
            int n = 0;
            for (int i = 0; i < 128; i++) {
                if (counts[i] > n) {
                    n = counts[i];
                    c = (char) i;
                }
            }

            // 循环构建结果
            while (counts[c]-- > 0) {
                results[index++] = c;
            }
        }

        return String.valueOf(results);
    }

效果

2ms 击败 99.80%

这种解法其实已经非常精简了，很赞！

JIT

可以达到 1ms 100%

小结

希望本文对你有帮助，如果有其他想法的话，也可以评论区和大家分享哦。

各位极客的点赞收藏转发，是老马持续写作的最大动力！

感兴趣的小伙伴可以关注一波，精彩内容，不容错过。

排序系列
前言
451. 根据字符出现频率排序
v1-HashMap 版本
- 思路
- 实现
- 效果
v2-对象替代 map
- 思路
- 实现
- 效果
v3-桶排序版本
- 思路
- 实现
- 效果
- 优化思路
  - 实现
  - 效果
v4-最快的方法
- 思路
- 实现
- 效果
- JIT
小结

leetcode sort 排序-09-bucket sort 桶排序 451. 根据字符出现频率排序