Python匹配HTML tag的时候，<.>和<.?>有什么区别？

参考答案：

在Python的正则表达式中，. 匹配除了换行符以外的任何单个字符，而 *? 是一个非贪婪（non-greedy）量词，它匹配尽可能少的字符。相反，* 是一个贪婪（greedy）量词，它会匹配尽可能多的字符。

因此，正则表达式 <.*> 和 <.*?> 在匹配HTML标签时会有不同的行为。

<.*>：这是一个贪婪匹配。它会匹配从第一个 <（即 <）开始，到最后一个 >（即 >）结束的所有内容。这可能会匹配到比你预期的更长的字符串，因为它会尽可能多地匹配字符。

例如，在字符串 "<a>Hello</a> <b>World</b>" 中，这个正则表达式会匹配整个字符串 "<a>Hello</a> <b>World</b>"，因为它会尽可能多地匹配字符，直到最后一个 > 字符。

使用同样的例子，这个正则表达式只会匹配到第一个HTML标签 "<a>Hello</a>"，因为它会尽可能少地匹配字符，只匹配到第一个 > 字符。

因此，在选择使用贪婪匹配还是非贪婪匹配时，你需要根据你的具体需求来决定。如果你想要匹配尽可能长的字符串，可以使用贪婪匹配；如果你只想匹配尽可能短的字符串，可以使用非贪婪匹配。