更多思路见文末获取!
MathorCup俗称妈杯,是除了美赛国赛外参赛人数首屈一指的比赛,而我们的妈杯今天也如期开赛。今年的妈杯难度,至少在我看来应该是2023年截至目前来讲最难的一场比赛。问题的设置、背景的选取等各个方面都吐露着我要难死你们的想法。难度是恒定的,难对于大家来说都难,大家平常心对待就可以。下面我将为大家带来各个赛题的浅要解析,以方便大家进行选题,以及提前预知该题将要面临的困难点。
优化问题 ABC,难度B>A>C。其他类型 D,数据处理+相关性分析+综合评价+预测
D题虽然类型涉及多,但是题目简单,模型选择不困难,对于优化模型不熟悉的队伍来说再好不过。综合难度
,个人认为B>A>C>D.。选题人数应该也和这个差不太多,预计明天公布选题人数统计。
题量除了D题有些大,但是每一问都不难。ABC题的题量都很小,可以慢慢攻克。意向选择D题的诸位就需要抓紧开始工作了,D题量真的不小。我也会首先更新D题的资料方便大家建模。
A 题 量子计算机在信用评分卡组合优化中的应用
A题给我的整体感觉就是和2020年国赛中小微企业的信贷决策有点相似,只能说问题设置背景相似。稍后我也将为大家整理当年国赛的一些资料方便大家进行比赛建模。A题的背景设置为银行的信用卡或者贷款的收入问题。由于涉及的很多的专业知识,在问题中都给出的很明确的定义以及示例展示,大家只要人人阅读就可以理解。对于问题的解决,还提出了一个
QUBO 模型,一个二次无约束二值优化模型,
上面就是一个目标函数是一个二次函数形式优化模型。相关的知识大家也可以自行搜索。下面我们主要看一下各个问题。
问题一,找出 1
张及其对应阈值,使最终收入最多。对于问题一就是一个简单的最优值的求解,设置对应的决策变量,我认为可以使用0-1变量引入,信用卡的使用与否,以及对应的阈值选择,最后利用题设中给出的收入计算公式进行求解就可以。问题难度不大,对于问题一结果的精度要求应该会很高,因此大家做完,一定要去网上看看对应对应结果,这种问题结果基本都差不多,所以就算跑不出来代码,我们也可以直接借鉴网上的代码。稍后也将为大家整理一下优化的相关代码。
问题二、已经选定了三个信用卡,让我们选择阈值进行计算最终收入。对于这个问题我们可以看作是问题三的一个方面。我们不再考虑信用卡的信息,而是单纯的考虑阈值。因此,这里我们也可以建立优化模型,个人还是感觉选择0-1变量设置决策变量会好一些。其次,设置收入为目标函数,进行计算即可。
问题三、就是一个问题一、问题二的综合。需要同时考虑信用卡的选取以及阈值的选取。对于这一问,我们通常会选择延用问题一二的模型,进行深入编写代码即可。综合来看,A题的最大难度似乎在于代码的编程实现,其实不然,现在有了GPT我们可以进行参考,同时对于A题这种对答案要求精度很好的题目,通常网上也是有一些公开的答案,在比赛期间。我们也是可以进行借鉴的。
因此,我个人认为A题不算太难,是妈杯的优化模型风格。主要还是对几个优化模型细节的把控。
B题 城市轨道交通列车时刻表优化问题
城市轨道交通列车时刻表优化问题给人的第一印象很容易让我想到概率论中,最经典的概率题。两个人A、B,到达一地一个人只会停留15分钟,问两人想遇的概率有多大。总会有种似曾相识的感觉。回到问题的题设,
给出了列车运行图示意图大家可以通读一下问题的设置示例,就很容易理解。有些可能目前看不到的难点,大家可以进行讨论一下。问题的背景引入,很多如果需要选择B题,就需要我们逐字逐句地仔细研读,这种比较大型的比赛,赛题中不会有一句废话。因此,大家一旦选用某个题目,一句一句的研读一定没有坏处。其中,题目也很明确的给=给出的目标函数,包括两部分,其中成本又包括两部分。
问题一,在满足客流需求的条件下,以企业运营成本最小化和服务水平最大化为目标,制定列车开行方案。对于问题的设问,约束条件都是显然的,我个人认为主要就是决策变量的选择。如何选择一个较好的决策变量能具体,简单的表示出我们的双目标,以及各个约束条件。这里,我的个人建议是参考输出示例,设置对应的决策变量,需要我们输出运营里程、开行数量,我们就可以对应的设置决策变量即可。
问题二、制定等间隔的平行运行图。这就需要改变我们问题一建立的模型用关于运营方面的决策变量进行求解即可。
对于整个B题而言,难点就在于问题一模型的建立,建立出模型进行求解即可。最大的问题主要就是答案的精度问题。对于这种纯开放式的题目,对于结果的精度要求很高,因此一旦我们的结果出现一点点偏差也能就会导致我们的奖项变动很大。相对于B题,A题的结果更容易获得,网上的公开结果应该也是A题更多一些,稍后我也将为大家分享一些网上的公开计算结果。
C 题 电商物流网络包裹应急调运与结构优化问题
问题C,题目的设置就是本科生专科生选题,因此在题目难度上应该会和AB,有明显的区别。整个问题的设置还是很符合妈杯的风格设置,下面我们简要的看一下各个题目设置。
问题一、要求我们建立线路货量的预测模型,我们可以看到给出的数据集是很大的。对于这一点我们可以理解为问题一是一个中长期预测,因此我们就可以选择机器学习LSTM这种长期预测模型,也可以选择一些短期预测模型最后进行加权计算,构建优化模型选择出最优的加权比重,这些预测方法都是可以的。问题一的难度不大,模型的选择主要还是看建模手的水平。
问题二、物流场地 DC5 关停,需要我们根据问题一预测的结果将DC5
相关线路的货量分配到其他线路。对于这一问,我们就需要对问题一的答案精度要求很高,只有基于较好精度的预测结果,我们后面的模型才有很好的结果。对于预测模型的结果,尤其是长期预测,结果是有很大的置信区间的。因此,我个人人为该题可以看作是一个答案开放式的。因此,大家放手去做即可。C题其实本意是一个结构优化问题,因此对于问题二三的求解实际上就需要哦们建立优化模型,以降低运营成本,提高运营效率为目标函数,构建决策变量进行优化是最正确的方式。当然,也可以另辟蹊径,只不过不太建议,就是分析各个物流场地之间的关系找相似度等等,应该也是有发挥空间的。
问题三、依旧可以理解为问题二的另一种情况,即被关停的物流场地为 DC9,对问题二建立的优化模型进行求解即可。
D 题 航空安全风险分析和飞行技术评估问题
D题基于QAR
数据进行一系列的问题设置。D题最大的好处就是不太需要优化知识,妈杯本身就是围绕着优化问题展开的一个比赛,因此对于不太熟悉优化模型,或者优化方向编程有困难的队伍来说,D题无疑是最好的选择。D题在我看来,可以看作一个数据分析,即可以理解为定量分析,与语文建模的说法类似。
问题一、标准的数据预处理题目,要求我们去伪存真,以减少错误数据对研究分析带来的影响。因此,我们对于这一问题主要就是数据的预处理。数据的预处理无非就是两个方面,异常值和缺失值。对于缺失值,我们可以选择直接剔除这一个样本,也可以选择利用插值等方式进行补充,这个处理方法因人而异。对于异常值,我们通常会选择第一步进行异常值的判定,去判定什么样的数值才算是异常值,通常常见的即使3σ原则,箱型图进行判定,也可以利用灰色系统等进行判定寻找离群点,都是可行的。
问题二、需要我们通过操纵杆的过程变化情况来分析
产生这种偏差的原因。问题二,目前在我看来类似于一个相关性分析。对于选择的变量数量不同,对应着不同的方法,这里大家可以根据自己选择的变量数据,关系,选择合适的关联因果分析方法。
问题三、我们进行的分析基本上都是定量分析,因此对于附录2给出的数据我们首先需要做的就是将表格东西数据化,以方便我们模型的建立求解分析。根据我们转化后的数据进行分析,进行语文建模即可,难度不大
问题四、需要我们根据数据建立评估模型,进行分析飞行员的飞行技术评估模型这里大家就可以理解为评价模型。根据附件三的数据集,有很多很多的指标,这里就比较推荐大家使用主成分分析法去分析这种很多指标的评估问题。当然,这里仅仅是建议,大家也可以选择自己适合的方法,或者想用的方法即可。熵权法、秩和比等等
问题五、标准的预警模型,需要我们建立一个预测模型,当达到模型情况时进行预警即可。难度不大,对于预测模型的选取,大家可以根据自己队伍的情况进行选择。这里比较推荐的时机器学习LSTM等一些长期预测,也可以灰色预测等等,都是可以的,根据建模手的实力,实际情况出发就可以。
总结:
优化问题 ABC,难度B>A>C。其他类型 D,数据处理+相关性分析+综合评价+预测
D题虽然类型涉及多,但是题目简单,模型选择不困难,对于优化模型不熟悉的队伍来说再好不过。综合难度
,个人认为B>A>C>D.。选题人数应该也和这个差不太多,预计明天公布选题人数统计。
最后,预祝大家比赛顺利!
更多思路获取方式如下: