数据结构与算法-实战(2)

11、算法与数据结构 - 实战：贪心问题

给定一个字符串数组，把数组里的所有字符串拼接起来，返回所有拼接结果中字典序最小的拼接结果

贪心解题方法论：

贪心解法无需证明正确性
写一个暴力解，与之进行比较，如果在任何样本下出来的结果都是一样的，则这个贪心策略就是正确的

错误的贪心策略：
比较两个字符串的字典序，字典序小的优先拼接。在这种贪心策略下，“b"和"ba"的拼接就是错误的，因为会得出"bba”，而实际是"ba"先拼接会更小"bab"，但是因为"b"的字典序比"ba"的字典序小，所有"b"会先拼接。

正确的贪心策略：
假如有字符串a和b，a拼接b表示为a.b，b拼接a表示b.a，如果a.b<=b.a，则a排前面，先拼接，否则b排前，先拼接。

/**
 * 给定一个字符串数组，把数组里的所有字符串拼接起来，返回所有拼接结果中字典序最小的拼接结果
 */
public class Greed01 {
   
     

    public static String findLowestDictionaryOrderAppend(String[] strs) {
   
     
        if (strs == null || strs.length == 0) return "";

        Arrays.sort(strs, (str1, str2) -> (str1 + str2).compareTo(str2 + str1));

        String result = "";
        for (String str : strs) {
   
     
            result += str;
        }

        return result;
    }

}

会议安排问题

一个会议室，若干场会议，会议室同一时间只能安排一场会议，
每场会议都有开始时间和结束时间，安排会议日程，要求安排的场次最多。

错误的贪心策略：
1、以会议开始时间排序，选开始时间早的；
2、以会议持续时间排序，选持续时间短的；

正确的贪心策略：
以结束时间排序，选结束时间早的。

/**
 * 会议安排问题
 * 一个会议室，若干场会议，会议室同一时间只能安排一场会议，
 * 每场会议都有开始时间和结束时间，安排会议日程，要求安排的场次最多
 */
public class Greed02 {
   
     

    public static int process(Meeting[] meetings) {
   
     
        if (meetings == null || meetings.length == 0) return 0;
        int result = 0;

        //根据结束时间早进行排序
        Arrays.sort(meetings, (o1, o2) -> o1.endTime - o2.endTime);
        int currentTime = 0;

        for (int i = 0; i < meetings.length; i++) {
   
     
            Meeting meeting = meetings[i];
            if (meeting.startTime <= currentTime) {
   
     
                result++;
                currentTime = meeting.endTime;
            }
        }

        return result;
    }

    public static class Meeting {
   
     
        private int startTime;
        private int endTime;
    }

}

街道放灯问题

给定一个字符串，代表一条街道，字符串中只有"."或者"x"两种字符，
"."代表居民楼，需要照亮并且可以放灯，灯可以照亮当前位置，以及前面后后面一个位置，
"x"代表墙，不需要照亮并且无法放灯，
如何放置灯才使得放置数量最少，
返回最少放灯数。

贪心解法：
1、如果当前位置i是"x"，直接跳到i+1；
2、如果当前位置i是".“，先灯数light++，然后看要跳到哪里如果i+1是"x”，则跳到i+2（i位置放灯），如果i+1是".“，跳到i+3（i+1位置放灯，i和i+2都被照亮，或者i+2是"x”）；

/**
 * 街道放灯问题
 * 给定一个字符串，代表一条街道，字符串中只有"."或者"x"两种字符，
 * "."代表居民楼，需要照亮并且可以放灯，灯可以照亮当前位置，以及前面后后面一个位置
 * "x"代表墙，不需要照亮并且无法放灯
 * 如果放置灯才使得放置数量最少
 * 返回最少放灯数
 */
public class Greed03 {
   
     

    public static int process(String road) {
   
     
        char[] chars = road.toCharArray();

        int result = 0;
        int index = 0;

        while (index < road.length()) {
   
     
            //如果当前位置时墙，直接跳过
            if (chars[index] == 'x') index++;
            else {
   
     
                //如果当前位置是灯，必然会放灯
                result++;
                //没有下一个位置，跳出循环
                if (index + 1 == road.length()) break;
                else {
   
     
                    //下一个位置是墙，那么等必须放在当前位置，然后跳到下下个位置
                    if (chars[index + 1] == 'x') index += 2;
                    //否则等放到下个位置，然后跳到下下下个位置
                    else index += 3;
                }
            }
        }
        return result;
    }

}

金条切分

给定一块金条，切分它需要花费和金条长度值一样的铜板个数，
给定一个数组，代表每个人期望分得的金条，
如何切分才能使得铜板花费个数最小，
最后返回铜板个数。

解法：哈夫曼编码
1、把数组的所有元素，放入小根堆；
2、一开始代价sum是0，最后要返回这个总代价sum；
3、只要小根堆不是只剩一个数，就弹出两个数累计为cur，cur累计到代价中，然后把cur放回小根堆；

/**
 * 金条切分
 * 给定一块金条，切分它需要花费和金条长度值一样的铜板个数
 * 给定一个数组，代表每个人期望分得的金条
 * 如何切分才能使得铜板花费个数最小，
 * 最后返回铜板个数
 */
public class Greed04 {
   
     

    public static int process(int[] arr) {
   
     
        PriorityQueue<Integer> q = new PriorityQueue<>();
        for (int i = 0; i < arr.length; i++) {
   
     
            q.add(arr[i]);
        }

        int sum = 0;
        int cur = 0;

        while (q.size() > 1) {
   
     
            cur = q.poll() + q.poll();
            sum += cur;
            q.add(cur);
        }
        return sum;
    }

}

一个人做项目

给定一个整形数组costArr，代表项目启动资金，
一个整形数组profitsArr，代表项目利润
一个整形k表示最多只能做k个项目，
一个整形w表示初始资金，
同一时间只能做一个项目（不能并行做），做完马上得到利润，然后去做下一个项目，
求最后获得的最大钱数。

解法：

1、设置两个堆，一个小跟堆（按花费排序，代表待解锁的项目），一个大根堆（按利润排序，表示已解锁的项目）；
2、每轮按照当前的金钱去解锁项目，把小跟堆中解锁的项目弹出放入大根堆，从大根堆拿出堆顶项目，代表选择做这个项目；
3、直到完成k轮；
4、返回累积的金钱数；

/**
 * 一个人做项目
 * 给定一个整形数组costArr，代表项目启动资金，
 * 一个整形数组profitsArr，代表项目利润
 * 一个整形k表示最多只能做k个项目，
 * 一个整形w表示初始资金
 * 同一时间只能做一个项目（不能并行做），做完马上得到利润，然后去做下一个项目
 * 求最后获得的最大钱数
 */
public class Greed05 {
   
     

    public static int process(int[] costArr, int[] profitsArr, int k, int w) {
   
     
        //按照花费排序的小跟堆
        PriorityQueue<Project> minCostProjects = new PriorityQueue<>((o1, o2) -> o1.cost - o2.cost);
        //按照利润排序的大根堆
        PriorityQueue<Project> maxProfitsProjects = new PriorityQueue<>((o1, o2) -> o2.profits - o1.profits);
        //组装成项目放入小根堆
        for (int i = 0; i < costArr.length; i++) {
   
     
            Project project = new Project();
            project.cost = costArr[i];
            project.profits = profitsArr[i];
            minCostProjects.add(project);
        }

        for (int i = 0; i < k; i++) {
   
     
            //把启动资金小于等于当前资金的项目，全部放入大根堆
            while (!minCostProjects.isEmpty() && w >= minCostProjects.peek().cost) maxProfitsProjects.add(minCostProjects.poll());
            //没有项目可做，提前结束
            if (maxProfitsProjects.isEmpty()) break;
            //从大根堆中挑出利润最大的项目
            w += maxProfitsProjects.poll().profits;
        }
        return w;
    }

    public static class Project {
   
     
        private int cost; //项目花费
        private int profits; //项目利润
    }

}

补充-哈夫曼编码

哈夫曼编码
构造任意字符串的比特流最小化的单词查找树，把出现频率最高的字符用最小的编码表示，并且所有的字符编码都不会成为其他编码的前缀。

算法流程：

输出端

1、读取输入；
2、将输入中的每个字符与其出现频率进行映射，构造一个map；
3、遍历map构造节点，并通过优先队列按频率从小到大排序；
4、根据频率构造哈夫曼树（单词查找树）；
5、根据哈夫曼树构造编码表，保存字符和编码间的映射；
6、将哈夫曼树编码为比特流并写出；
7、将字符总数编码为比特流并写出；
8、将字符串编码为比特流并写出；

读取端

1、读取哈夫曼树；
2、读取字符数量；
3、使用哈夫曼树将比特流解码；

如何构造哈夫曼树？
从优先队列中取出两个当前频率最小的节点，构成一个树，父节点的频率为两子节点频率值之和，在将该父节点入队列；重复该过程，最后得出根节点。

如果编码和解码哈夫曼树？

编码：前序遍历，遇到非叶子节点，则输出0，遇到叶子节点则输出1然后输出字符代表的字节流。
解码：前序遍历创建节点，遇到0则创建一个空节点并递归创建其左右子节点，遇到1则创建叶子节点保存后面读取的字符。

public class Huffman {
   
     
	
	public static void main(String[] args) {
   
     
		 Huffman huffman = new Huffman();
		 String input = "it was the best of times it was the worst of times";
		String compress = huffman.compress(input);
		String unCompress = huffman.unCompress(compress);
		System.out.println("result is: " + input.equals(unCompress));
	}
	
	private static class Node implements Comparable<Node> {
   
     
		private char ch;
		private int freq;
		private Node left;
		private Node right;
		public Node(char ch, int freq, Node left, Node right) {
   
     
			this.ch = ch;
			this.freq = freq;
			this.left = left;
			this.right = right;
		}
		@Override
		public int compareTo(Node that) {
   
     
			return this.freq - that.freq;
		}
		public boolean isLeaf() {
   
     
			return this.left == null && this.right == null;
		}
	}
	
	/**
	 * 解压还原字符串
	 * @param codes 编码字符串
	 * @return 还原后的字符串
	 */
	public String unCompress(String codes) {
   
     
		// 1.解析获取哈夫曼树
		AtomicInteger indexCounter = new AtomicInteger(0);
		Node root = parseHuffmanTree(codes, indexCounter);
		// 2.	读取字符数量
		int len = parseInputLen(codes, indexCounter);
		System.out.println("input string length: " + len);
		// 3.	使用哈夫曼树将比特流解码
		StringBuilder res = new StringBuilder();
		for (int i = 0; i < len; i++) {
   
     
			char c = parseOneChar(root, codes, indexCounter);
			res.append(c);
		}
		System.out.println("uncompress string: " + res.toString());
		return res.toString();
	}
	
	/**
	 * 解析获取一个字符串：
	 * 判断二进制字符串当前下标的字符是0还是1，
	 * 0则递归左节点，1则递归右节点，
	 * 直到当前节点是叶子节点，则返回该节点对应的字符
	 * @param node 当前的哈夫曼节点
	 * @param codes 编码后的二进制字符串
	 * @param indexCounter 下标计数器，保存当前解析到的下标
	 * @return 解析后的字符
	 */
	private char parseOneChar(Node node, String codes, AtomicInteger indexCounter) {
   
     
		if (node.isLeaf()) {
   
     
			return node.ch;
		} else {
   
     
			int i = codes.charAt(indexCounter.getAndIncrement());
			if (i == '0') {
   
     
				return parseOneChar(node.left, codes, indexCounter);
			} else {
   
     
				return parseOneChar(node.right, codes, indexCounter);
			}
		}
	}

	/**
	 * 解析获取输入字符串的长度
	 * @param codes 编码后的二进制字符串
	 * @param indexCounter 下标计数器，保存当前解析到的下标
	 * @return 输入字符串长度
	 */
	private int parseInputLen(String codes, AtomicInteger indexCounter) {
   
     
		String inputLenBianryStr = codes.substring(indexCounter.get(), indexCounter.addAndGet(32));
		return Integer.valueOf(inputLenBianryStr.toString(), 2);
	}

	/**
	 * 解析获取哈夫曼树：
	 * 前序遍历创建节点，
	 * 遇到0则创建一个空节点并递归创建其左右子节点，
	 * 遇到1则创建叶子几点保存后面读取的字符
	 * @param codes 编码后的二进制字符串
	 * @param indexCounter 下标计数器，保存当前解析到的下标
	 * @return 哈夫曼树根节点
	 */
	private Node parseHuffmanTree(String codes, AtomicInteger indexCounter) {
   
     
		if (codes.charAt(indexCounter.get()) == '1') {
   
     
			String charBinaryStr = codes.substring(indexCounter.incrementAndGet(), indexCounter.addAndGet(8));
			return new Node(new String(new byte[] {
   
     Byte.valueOf(charBinaryStr, 2)}).charAt(0), 0, null, null);
		} else {
   
     
			indexCounter.incrementAndGet();
			return new Node('\0', 0, parseHuffmanTree(codes, indexCounter), parseHuffmanTree(codes, indexCounter));
		}
	}

	/**
	 * 利用哈夫曼压缩法压缩字符串
	 * @param input 输入字符串
	 * @return 压缩后的编码字符串
	 */
	public String compress(String input) {
   
     
		// 1.	读取输入，构造一颗哈夫曼树
		System.out.println("input string: " + input);
		Node root = buildTree(input);
		// 2.根据哈夫曼树构造编码表，保存字符和编码间的映射
		Map<Character, String> huffmanCodeTable = new HashMap<>();
		buildCodeTable(huffmanCodeTable, root, "");
		System.out.println("huffmanCodeTable: " + huffmanCodeTable);
		// 3.将哈夫曼树编码为比特流字符串
		StringBuilder huffmanCodes = new StringBuilder();
		codinghuffmanTree(root, huffmanCodes);
		// 4.将字符总数编码为比特流字符串
		huffmanCodes.append(getInputLenBinaryStr(input.length()));
		// 5.	将字符串编码为比特流并字符串
		codingInputStr(input, huffmanCodeTable, huffmanCodes);
		System.out.println("compress string: " + huffmanCodes.toString());
		return huffmanCodes.toString();
	}
	
	/**
	 * 将字符串编码为比特流并字符串
	 * @param input 输入字符串
	 * @param huffmanCodeTable 编码表
	 * @param huffmanCodes 编码后的二进制字符串
	 */
	private void codingInputStr(String input, Map<Character, String> huffmanCodeTable, StringBuilder huffmanCodes) {
   
     
		for (int i = 0; i < input.length(); i++) {
   
     
			huffmanCodes.append(huffmanCodeTable.get(input.charAt(i)));
		}
	}

	/**
	 * 获取输入字符串长度的二进制字符串
	 * @param len 输入字符串长度
	 * @return 长度的二进制字符串
	 */
	private String getInputLenBinaryStr(int len) {
   
     
		String binaryStr = Integer.toBinaryString(len);
		int n = 32 - binaryStr.length();
		StringBuilder binaryRes = new StringBuilder();
		for (int i = n; i > 0; i--) binaryRes.append("0");
		binaryRes.append(binaryStr);
		return binaryRes.toString();
	}
	
	/**
	 * 获取字符对应的二进制字符串
	 * @param ch 输入字符
	 * @return 二进制字符串
	 */
	private String getBinaryStr(char ch) {
   
     
		String binaryStr = Integer.toBinaryString(ch | 256);
		binaryStr = binaryStr.substring(binaryStr.length()-8);
		return binaryStr;
	}
	
	/**
	 * 把哈夫曼树编码为二进制字符串
	 * 前序遍历，遇到非叶子节点，则输出0，遇到叶子节点则输出1然后输出字符代表的二进制字符串
	 * @param root 哈夫曼树根节点
	 * @return 编码后的二进制字符串
	 */
	private void codinghuffmanTree(Node node, StringBuilder huffmanCodes) {
   
     
		if (node.isLeaf()) {
   
     
			huffmanCodes.append("1");
			huffmanCodes.append(getBinaryStr(node.ch));
		} else {
   
     
			huffmanCodes.append("0");
			codinghuffmanTree(node.left, huffmanCodes);
			codinghuffmanTree(node.right, huffmanCodes);
		}
	}

	/**
	 * 根据哈夫曼树构造编码表，保存字符和编码间的映射
	 * 左：0；右：1
	 * @param huffmanCodeTable 哈夫曼编码表
	 * @param root 哈夫曼树根节点
	 */
	private void buildCodeTable(Map<Character, String> huffmanCodeTable, Node node, String code) {
   
     
		if (node.isLeaf()) {
   
     
			huffmanCodeTable.put(node.ch, code);
			return;
		}
		buildCodeTable(huffmanCodeTable, node.left, code+"0");
		buildCodeTable(huffmanCodeTable, node.right, code+"1");
	}

	/**
	 * 构造哈夫曼树
	 * @param input 输入字符串
	 * @return 哈夫曼树根节点
	 */
	private Node buildTree(String input) {
   
     
		// 1.	将输入中的每个字符与其出现频率进行映射，构造一个map
		Map<Character, Integer> charTable = new HashMap<>();
		for (int i = 0; i < input.length(); i++) {
   
     
			if (charTable.containsKey(input.charAt(i))) {
   
     
				charTable.put(input.charAt(i), charTable.get(input.charAt(i))  + 1);
			} else {
   
     
				charTable.put(input.charAt(i), 1);
			}
		}
		// 2.	遍历map构造节点，并通过优先队列按频率从小到大排序
		PriorityQueue<Node> queue = new PriorityQueue<>();
		for (Entry<Character, Integer> entry : charTable.entrySet()) {
   
     
			queue.offer(new Node(entry.getKey(), entry.getValue(), null, null));
		}
		/*
		 * 构造哈夫曼树:
		 * 从优先队列中取出两个当前频率最小的节点，构成一个树，
		 * 父节点的频率为两子节点频率值之和；
		 * 再将该父节点入队列；
		 * 重复该过程，最后得出返回根节点。
		 * */
		while (queue.size() > 1) {
   
     
			Node node1 = queue.poll();
			Node node2 = queue.poll();
			queue.offer(new Node('\0', node1.freq + node2.freq, node1, node2));
		}
		return queue.poll();
	}
	
}