优化子集和实现

Optimizing subset sum implementation

本文关键字:实现 子集 优化      更新时间:2023-10-16

我正在使用下面的代码来解决子集和问题的一个变体。这个问题需要从一个较大的集合(超集)中生成11 int的子集,并检查它是否与特定的值(endsum)匹配。

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
int endsum = 0, supersetsize = 0, done = 0;
int superset[] = {1,30,10,7,11,27,3,5,6,50,45,32,25,67,13,37,19,52,18,9};
int combo = 0;
int searchForPlayerInArray(int arr[], int player) {
    for (int i=0; i<11; i++) {
        if (arr[i] == player) {
            return 1;
        }
    }
    return 0;
}
int sumOfArray(int arr[]) {
    int res = 0;
    for (int i=0; i<11; i++) {
        res+=arr[i];
    }
    return res;
}
void printArray(int arr[], int arrSize) {
    for (int j=0; j<arrSize; j++) {
        printf("%2d ",arr[j]);
    }
    printf("= %dn",endsum);
}
void permute(int subset[], int pos, int sspos) {
    if (done) { //when a correct solution has been found, stop recursion
        return;
    }
    if (sspos == supersetsize) { // out of possible additions
        return;
    }
    if (pos == 11) { //is the current subset 11 ints long?
        int res = sumOfArray(subset);
        combo++;
        if (res == endsum) { //if the sum of the array matches the wanted sum, print
            printArray(subset,11);
            done = 1;
        }
        return;
    }
    for (int i=sspos; i<supersetsize; i++) {
        //assert(pos < 11);
        //assert(i+1 <= supersetsize);
        subset[pos] = superset[i];
        permute(subset,pos+1,i+1);
    }
}
int main(void) {
    endsum = 110;
    supersetsize = 20;
    int *arr;
    arr = malloc(supersetsize*sizeof(int));
    int i;
    for (i=0; i<supersetsize; i++) {
        arr[i] = 0;
    }
    permute(arr,0,0);
    printf("Combinations: %d",combo);
    return 0;
}

尽管这种解决方案适用于小超集(<15),但它速度慢且效率低,因为它生成了所有可能的排列,而不仅仅是唯一的排列。如何优化它以只生成唯一的子集?

编辑:根据流行需求添加的完整源代码。

只生成唯一子集的一种方法是按顺序添加超集中的元素,并对permute(例如supersetPos)使用一个额外的参数来指示您在超集中的位置。这将生成唯一的排序排列。

编辑:AFAIK在样本上正确运行的代码:

#include <stdio.h>
int superset[] = {
 1, 30, 10, 7, 11,
 27, 3, 5, 6, 50,
 45, 32, 25, 67, 13,
 37, 19, 52, 18, 9
};
int supersetsize = 20;
int endsum = 110;
int done = 0;
int sumOfArray(int array[]) {
  int sum = 0;
  for(int i = 0; i < 11; i++)
      sum += array[i];
  return sum;
}
void permute(int subset[], int pos, int sspos) {
    if (pos == 11) { //is the current subset 11 ints long?
        if (sumOfArray(subset) == endsum) { //if the sum of the array matches the wanted sum, print
            for (int j=0; j<11; j++) {
                printf("%d ",subset[j]);
            }
            printf("n");
            done = 1;
        }
        return;
    }
    for (int i=sspos; i<supersetsize; i++) {
        subset[pos] = superset[i];
        permute(subset,pos+1,i+1);
        if (done) { //when a correct solution has been found, stop recursion
            return;
        }
    }
}
int main() {
  int subset[11] = {0};
  permute(subset, 0, 0);
}

我认为没有办法在比指数时间更好的时间内生成唯一子集。

为了有效地求解子集和,您需要使用动态编程。有一些子集和的伪多项式时间算法是这样工作的。维基百科上的这篇文章可能会有所帮助。

你可以试试我的代码(我试图只给出一个psudo代码,而不是完全解决你的作业):

// array is all the numbers you are looking from them
// length is the number of arrays
// pos is the position of the slot you are going to fill
// max is nomber of slots you have to fill (in your case since you are going for the 11 sets you have to set this value as 11
// sum is the sum of all the values selected until now
// searchbegin is the first element you can pick from your array (I'm using this variable to only generate subarrays of the superset (array))
// target is the targetvalue you are looking for.
void generate_all(int []array, int length, int pos,int max, int sum,int searchbegin,int target)
{
    if max = pos
        if sum = target
            printselectedresults();
    for i:searchbegin->length-max+pos
        if (sum + array[i] < target)
        {
            addtoresults(i);
            generate_all(array,length,pos+1,max,sum+array[i],i+1,target);
            removefromresults(i);
        }
}

有了所有这些信息,我认为你可以很容易地实现你的目标语言并使用它

在我的函数中,所有生成的排列都是超集的子数组,因此不能生成两次排列,而且每个排列都至少生成一次。