您将如何改进此算法?(c字符串反转)
How would you improve this algorithm? (c string reversal)
通过在网上发现的一些编程面试挑战,我不得不编写一个算法来反转const char*并返回一个指向新char*的指针。我想我有它,但为了让它正常工作,我不得不做一些不稳定的事情——基本上必须自己解释空终止字符。不知怎么的,我觉得这是错误的,但我被难住了,我想知道是否有人能帮我:
char * reverse(const char * str)
{
int length = strlen(str);
char * reversed_string = new char[length+1];
for(int i = 0; i < length; ++i)
{
reversed_string[i] = str[(length-1) - i];
}
//need to null terminate the string
reversed_string[length] = ' ';
return reversed_string;
}
int main(int argc, char * argv[])
{
char * rev_str = reverse("Testing");
cout << "Your string reversed is this: " << rev_str << endl;
delete rev_str;
rev_str = 0;
return 0;
}
<algorithm>
中的std::reverse
适用于字符串和char
数组:
string str = "Hello";
char chx[] = "Hello";
reverse(str.begin(), str.end());
reverse(chx, chx + strlen(chx));
cout << str << endl;
cout << chx << endl;
/编辑:这当然会修改原始字符串。但STL出手相救。下面创建一个新的反向字符串。不幸的是(?),如果不创建额外的(隐式)副本:,这不能直接在char
阵列上工作
string reverse_string(string const& old) {
return string(old.rbegin(), old.rend());
}
cout << reverse_string("Hello") << endl;
我曾经有过这个问题。这是我脑海中浮现的第一个答案,但接下来的答案是,"现在在不分配任何内存的情况下进行。"
int length = strlen(string);
for(int i = 0; i < length/2; i++) {
char c = string[i];
string[i] = string[length - i];
string[length - i] = c;
}
编辑:有些人对不使用指针表示不屑。这是一个稍微可读一点,虽然不是完全优化。其他人已经输入了指针解决方案,所以我在此不再重复。
一位评论者质疑说,在没有(基于堆栈的)交换保持单元的情况下,这应该是可行的。这样做的机制是逐位XOR。用替换环路内部
string[i] = string[i] ^ string[length - i];
string[length - i] = string[i] ^ string[length - i];
string[i] = string[i] ^ string[length - i];
但一般来说,现代编译器可以优化出天真交换的局部变量。有关详细信息,请参阅Wikipedia
if( string[0] )
{
char *end = string + strlen(string)-1;
while( start < end )
{
char temp = *string;
*string++ = *end;
*end-- = temp;
}
}
您的代码直截了当,不足为奇。几件事:
- 使用size_t而不是int作为循环索引
- 虽然您的编译器很可能足够聪明,能够弄清楚(length-1)是不变的,但它可能还不够聪明,无法弄清楚(longth-1)-i最好由一个不同的循环变量代替,该变量在每次循环中都会递减
- 我会使用指针而不是数组语法——对我来说,使用*dst--=*src++会更干净;在循环中
换句话说:
char *dst = reversed_string + length;
*dst-- = ' ';
while (*src) {
*dst-- = *src++;
}
嗯?没有人用指针做这件事?
char *reverse(const char *s) {
size_t n = strlen(s);
char *dest = new char[n + 1];
char *d = (dest + n - 1);
dest[n] = 0;
while (*s) {
*d-- = *s++
}
return dest;
}
希望多年的Java没有毁了我的C;-)
编辑:用一个额外的变量替换了所有这些strlen调用。这些天strlen返回了什么?(感谢底座)。
我知道这是非常不可移植的,但x86汇编指令bswap允许您仅通过一条指令交换四个字节,这可能是增强代码的好途径。
这是一个如何让它与GCC一起工作的例子。
/*
* reverse.c
*
* $20081020 23:33 fernando DOT miguelez AT gmail DOT com$
*/
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#define MAX_CHARS 10 * 1024 * 1024
/*
* Borrowed from http://coding.derkeiler.com/Archive/Assembler/comp.lang.asm.x86/2007-03/msg00004.html
* GNU Compiler syntax
*/
inline uint32_t bswap(uint32_t val)
{
__asm__("bswap %0" : "=r" (val) : "0" (val));
return val;
}
char * reverseAsm(const char * str)
{
int i;
int length = strlen(str);
int dwordLength = length/4;
if(length % 4 != 0)
{
printf("Error: Input string length must be multiple of 4: %dn", length);
return NULL;
}
char * reversed_string = (char *) malloc(length+1);
for(i = 0; i < dwordLength; i++)
{
*(((uint32_t *) reversed_string) + dwordLength - i - 1) = bswap(*(((uint32_t *) str) + i));
}
reversed_string[length] = ' ';
return reversed_string;
}
char * reverse(const char * str)
{
int i;
int length = strlen(str);
char * reversed_string = (char *) malloc(length+1);
for(i = 0; i < length; ++i)
{
reversed_string[i] = str[(length-1) - i];
}
//need to null terminate the string
reversed_string[length] = ' ';
return reversed_string;
}
int main(void)
{
int i;
char *reversed_str, *reversed_str2;
clock_t start, total;
char *str = (char *) malloc(MAX_CHARS+1);
str[MAX_CHARS] = ' ';
srand(time(0));
for(i = 0; i < MAX_CHARS; i++)
{
str[i] = 'A' + rand() % 26;
}
start = clock();
reversed_str = reverse(str);
total = clock() - start;
if(reversed_str != NULL)
{
printf("Total clock ticks to reverse %d chars with pure C method: %dn", MAX_CHARS, total);
free(reversed_str);
}
start = clock();
reversed_str2 = reverseAsm(str);
total = clock() - start;
if(reversed_str2 != NULL)
{
printf("Total clock ticks to reverse %d chars with ASM+C method: %dn", MAX_CHARS, total);
free(reversed_str2);
}
free(str);
return 0;
}
在Cygwin:下我的旧电脑上的结果
fer@fernando /cygdrive/c/tmp$ ./reverse.exe
Total clock ticks to reverse 10485760 chars with pure C method: 221
Total clock ticks to reverse 10485760 chars with ASM+C method: 140
@Konrad Rudolph:(对不起,我没有发表评论的"经验")
我想指出的是,STL提供了一个reverse_copy()算法,类似于reverse()。您不需要像以前那样引入临时字符,只需分配一个大小合适的新字符即可。
您不能(不应该)这样做:
string[i] ^= string[length - i] ^= string[i] ^= string[length - i];
发件人:http://en.wikipedia.org/wiki/XOR_swap_algorithm#Code_example
- *"此代码具有未定义的行为,因为它在没有插入序列点的情况下两次修改左值x
实际上,考虑到原始字符串保持不变的约束,我认为问题中给出的原始方法是最好的。所有这些奇特的方法都很好地扭转了人们发布的内容,但一旦考虑到复制给定的字符串,它们的效率都不如简单地向后复制字符串。
我们以前使用过这个问题,结果发现很多人做不到(即使有丰富的C/C++经验!)。我更喜欢就地变体,因为它节省了一些开销,并且只需要迭代strlen(s)/2个字符。
你在面试中的解决方案很好。使用指针而不是数组语法的(正确!)解决方案会得到更高的评价,因为它对C/C++编程中至关重要的指针显示出更高的舒适度。
次要的批评是指出strlen返回的是size_t而不是int,并且应该在rev_str上使用delete[]。
WRT:"现在不使用临时持有变量"。。。也许是这样的(现在保持数组索引):
int length = strlen(string);
for(int i = 0; i < length/2; i++) {
string[i] ^= string[length - i];
string[length - i] ^= string[i];
string[i] ^= string[length - i];
}
这很好用:
#include <algorithm>
#include <iostream>
#include <cstring>
void reverse_string(char *str) {
char *end = str + strlen(str) - 1;
while (str < end) {
std::iter_swap(str++, end--);
}
}
int main() {
char s[] = "this is a test";
reverse_string(s);
std::cout << "[" << s << "]" << std::endl;
}
我会像这样解决它(不过我的c有点生疏,请原谅)
char *reverse( const char *source ) {
int len = strlen( source );
char *dest = new char[ len + 1 ];
int i = 0;
int j = len;
while( j > 0 ) {
dest[j--] = src[i++];
}
dest[i] = ;
return dest;
}
它的效率不会更高,但您可以通过将每个字母推到堆栈上,然后将它们弹出到新分配的缓冲区来展示数据结构的知识。
这需要两次传球和一次scratch stack,但我可能更相信自己,第一次就把球打对,而不是像上面那样一次失误。
char* stringReverse(const char* sInput)
{
std::size_t nLen = strlen(sInput);
std::stack<char> charStack;
for(std::size_t i = 0; i < nLen; ++i)
{
charStack.push(sInput[i]);
}
char * result = new char[nLen + 1];
std::size_t counter = 0;
while (!charStack.empty())
{
result[counter++] = charStack.top();
charStack.pop();
}
result[counter] = ' ';
return result;
}
作为面试官,当我问这个问题时,我希望找到一个干净、易懂的解决方案,并可能会问如何使最初的解决方案更有效率。我对"智能"解决方案不感兴趣。
我在想这样的事情;候选人是否在循环中犯了一个错误,他们是否预先分配了足够的内存,是否检查了错误的输入,是否充分使用有效类型。
不幸的是,正如已经指出的,太多人甚至不能做到这一点。
字符串反转到位,没有临时变量。
static inline void
byteswap (char *a, char *b)
{
*a = *a^*b;
*b = *a^*b;
*a = *a^*b;
}
void
reverse (char *string)
{
char *end = string + strlen(string) - 1;
while (string < end) {
byteswap(string++, end--);
}
}
一种不需要临时变量的方法
int length = strlen(string);
for(int i = 0; i < length/2; i++) {
string[i] ^= string[length - i] ^= string[i] ^= string[length - i];
}
如果我在面试,我会对解决方案的质量更加挑剔,因为它的稳健性,而不仅仅是性能。
如果传递了一个空指针,那么迄今为止提交的所有答案都将失败,其中大多数答案会立即调用可能的空指针上的strlen()
,这可能会中断您的进程。
许多答案都痴迷于性能,以至于错过了问题的一个关键问题:反转const char *
,即您需要制作一个反转的副本,而不是原地反转。如果需要副本,您会发现很难将迭代次数减半!
这是一个采访问题,所以我们想了解算法的细节,但在现实世界中,这只是强调了尽可能使用标准库的价值。
。
char * reverse(const char * str)
{
if (!str)
return NULL;
int length = strlen(str);
char * reversed_string = new char[length+1];
for(int i = 0; i < length/2; ++i)
{
reversed_string[i] = str[(length-1) - i];
reversed_string[(length-1) - i] = str[i];
}
//need to null terminate the string
reversed_string[length] = ' ';
return reversed_string;
}
一半的时间,但相同的复杂性(注意可能会因为一个错误而关闭)
上面的循环有打字错误。循环变量i的检查应为<=代替<,对于奇数个元素,othrewise将失败。对于(int i=0;i<=长度/2;++i)