g_ascii_strcasecmp Java 中的等效项
g_ascii_strcasecmp equivalent in java
我有一个使用g_ascii_strcasecmp函数排序的单词列表。我需要在 java 中处理此列表。Java 中的等效排序函数是什么?为了实现二进制搜索,我需要一个正确的比较函数。到目前为止,我有下面的函数,但它并不总是产生正确的结果。
public int compareStrings(String str) {
Collator collator = Collator.getInstance();//TODO: implement locale?
return collator.compare(this.wordString, str);
}
更新。列出示例:"T,t,太极拳,t'other,T-,T骨,T骨牛排,T-结,塔巴斯科,塔巴萨兰,虎斑"。
我不会使用 Collator
,阅读了它的 Javadoc,因为您无法控制字符串的比较方式。 您可以选择区域设置,但该区域设置如何告诉Collator
如何比较字符串是您无法控制的。
如果您知道字符串中的字符都是 ASCII 字符,那么我将只使用 String.compareTo()
方法,该方法根据 unicode 字符值按字典顺序排序。 如果字符串中的所有字符都是 ASCII 字符,则它们的 unicode 字符值将是它们的 ASCII 值,因此按字典顺序对其 unicode 值进行排序与按字典顺序对其 ASCII 值进行排序相同,这似乎是g_ascii_stcasecmp
所做的。 如果您需要不区分大小写,您可以使用 String.compareToIgnoreCase()
.
正如我在评论中指出的,我认为您需要编写自己的比较函数。 您需要遍历字符串中的字符,跳过不在 ASCII 范围内的字符。 所以像这样的东西,这是一个简单、愚蠢的实现,需要加强以涵盖我认为g_ascii_strcasecmp
的极端情况:
public int compareStrings(String str) {
List<Character> myAsciiChars = onlyAsciiChars(this.wordString);
List<Character> theirAsciiChars = onlyAsciiChars(str);
if (myAsciiChars.size() > theirAsciiChars.size()) {
return 1;
}
else if (myAsciiChars.size() < theirAsciiChars.size()) {
return -1;
}
for (int i=0; i < myAsciiChars.size(); i++) {
if (myAsciiChars.get(i) > theirAsciiChars.get(i)) {
return 1;
}
else if (myAsciiChars.get(i) < theirAsciiChars.get(i)) {
return -1;
}
}
return 0;
}
private final static char MAX_ASCII_VALUE = 127; // (Or 255 if using extended ASCII)
private List<Character> onlyAsciiChars(String s) {
List<Character> asciiChars = new ArrayList<>();
for (char c : s.toCharArray()) {
if (c <= MAX_ASCII_VALUE) {
asciiChars.add(c);
}
}
return asciiChars;
}
我决定分享我想出的方法:
/**
* Compares two strings, ignoring the case of ASCII characters. It treats
* non-ASCII characters taking in account case differences. This is an
* attempt to mimic glib's string utility function
* <a href="http://developer.gnome.org/glib/2.28/glib-String-Utility-Functions.html#g-ascii-strcasecmp">g_ascii_strcasecmp ()</a>.
*
* This is a slightly modified version of java.lang.String.CASE_INSENSITIVE_ORDER.compare(String s1, String s2) method.
*
* @param str1 string to compare with str2
* @param str2 string to compare with str1
* @return 0 if the strings match, a negative value if str1 < str2, or a positive value if str1 > str2
*/
private static int compareToIgnoreCaseASCIIOnly(String str1, String str2) {
int n1 = str1.length();
int n2 = str2.length();
int min = Math.min(n1, n2);
for (int i = 0; i < min; i++) {
char c1 = str1.charAt(i);
char c2 = str2.charAt(i);
if (c1 != c2) {
if ((int) c1 > 127 || (int) c2 > 127) { //if non-ASCII char
return c1 - c2;
} else {
c1 = Character.toUpperCase(c1);
c2 = Character.toUpperCase(c2);
if(c1 != c2) {
c1 = Character.toLowerCase(c1);
c2 = Character.toLowerCase(c2);
if(c1 != c2) {
return c1 - c2;
}
}
}
}
}
return n1 - n2;
}
相关文章:
- 在java中解决这段代码时面临循环中的问题
- 尝试用java代码编译和运行c++代码
- 在这种情况下,java对象是否可以调用本机函数
- C++,在int数组中输入字符串或字符会输出0,而不是ascii或error
- 在java中读取c++字节的位字段
- 为什么C++对链表中的下一个节点使用指针,而像 C# 或 Java 这样的语言只使用类 Node 的名称?
- 使用已使用 java 编码的 openssl 解码数据
- 为什么我的C++程序的程序集输出充满了 .ascii,没有汇编代码?
- 有没有办法通过使用十进制 ASCII 代码自动类型扣除来获取字符?
- 如何将字节数组元素替换为修改的十六进制 ASCII 符号?
- SWIG Java 在使用 -DSWIGWORDSIZE64 时将int64_t转换为 jlong
- ascii 和 unicode 在处理级别有什么区别吗?
- Android Java USB for native cpp
- 在C++中使用 ASCII 代码将输入从小写转换为大写
- 弄清楚如何在C++中将整数读入 ASCII
- 在由Sublime文本3编译后在cmd上显示Java程序输出
- C++ equivalent to Java Map getOrDefault?
- C++ 中的 Java 样式枚举
- 是否有技术原因阻止 Java 中的 final C++ 像 const 一样严格?
- ASCII 码等同于 Java 中的 unicode 字符