stan的博客

大火成灰,闷绝不燃


  • 首页

  • 标签

  • 分类

  • 归档

  • 站点地图

apk链接提取应用名称及包名

发表于 2018-09-26 | 阅读次数:

根据apk链接获取apk包名应用名

  • 最近有个需求,根据apk链接获取apk的包名和应用名。
  • 正常手段是这样,下载完整的apk,然后利用apktool解压分析,完事。这样的操作,一方面需要大量时间下载,一方面也浪费磁盘空间(需要解压)。
  • 进一步的思路是,不利用apktool解压。因为apk文件是zip压缩格式,于是我们可以根据zip格式来分析apk二进制文件(不需要解压了)。
  • 现在基本上apk都支持流下载,那么我们也可以做个流解压提取我们的信息。

  • 查阅apk和zip压缩格式,主要得到以下几个信息。

zip压缩格式:

本地文件头1
文件数据1
数据描述符1

以上重复若干次

本地文件头 n
文件数据 n
数据描述符n

archive decryption header(EFS) 
archive extra data record (EFS)
中央目录
zip64的中央目录记录结束
zip64的中央目录定位结束
中央目录记录结束
阅读全文 »

Python下XGBoost配置GPU

发表于 2017-10-09 | 阅读次数:

可以注意到,在最新版的XGBoost已经支持GPU运行了。以下我将介绍如何在python下配置xgb支持gpu。

##必要环境

  • 安装git
    • 如果你安装了桌面版的github 自带了gitshell
    • Windows10勾选开发者模式bash也可使用
  • 安装cmake
    • 选择的是3.9.4版本的cmake-3.9.4-win64-x64.msi
    • 一直下一步 并勾选添加到path。
  • 安装cuda
    • cuda9.0
    • 选择的是win10版本
    • local与network的区别参见官网 在此选择的local
      阅读全文 »

应该考研还是毕业工作

发表于 2017-10-02 | 阅读次数:

作者:但愿
链接:https://www.zhihu.com/question/54146603/answer/241427273
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

①昨天我去小区的小卖部买东西,老板和我谈到他的女儿因为高考成绩不是很好,最后读了一个民办高校的事。现在女儿刚刚读大学2个月,向父亲表态,一定要“考研”,离开这个学校,去往更好的学校求学。父亲于是问我,大一怎么准备考研?到底是工作好还是考研好?我沉吟一下,你女儿是不是只是热衷于“表态”,而并不想认真准备考研呢?我这么思考是有原因的。如果真是想考某个大学的硕士研究生,一个当下最好的办法,就是离开正在读的民办高校,回到高中复读一年,争取考到这个大学的本科生,再在这个大学读4年书,大四时候选择考本校的研究生。而不是在一个民办高校里,用四年时间和外在环境做斗争,不断加深自律学习,毕竟环境给人带来的制约作用实在是太大了。

阅读全文 »

xgboost参数

发表于 2017-10-02 | 阅读次数:

XGBoost中参数调优

本文参考xgboost官方文档以及python中xgboost参数设置而作。

使用语言:python

  • 采用python的XGBoost模块有一个sklearn包,XGBClassifier
    目的: 是为了自己在写一个调参库前能有一个细节理解。鉴于本人拙劣的思维,如有错误可以在评论区提出。

参数组成

  • 参数主要为3部分
    • General Parameters
    • Booster Parameters
    • Learning Task Parameters
      阅读全文 »

千里码Markdown题目

发表于 2017-10-01 | 阅读次数:
  • 练习Markdown语法~

#Markdown: 让书写更美好

##Markdown简介

Markdown 是一种轻量级标记语言,创始人为约翰·格鲁伯(John Gruber)。它允许人们“使用易读易写的纯文本格式编写文档,然后转换成有效的XHTML(或者HTML)文档”。[1]这种语言吸收了很多在电子邮件中已有的纯文本标记的特性。 ——维基百科

优点:

  • 简单,容易上手
  • 纯文本实现,程序员最爱,容易扩展,方便和其他工具联动
  • 平台支持广:以Github为首的各种平台、各种博客都支持,基本上现在面向程序员的输入框都可以用Markdown来写了
  • 丰富的工具链
    • 编辑器:各种支持所见即所得的编辑器
    • 和各种其他格式互相转化的工具,PDF、Mobi、Epub、HTML等等,几乎你能想到的所有格式它都能转

##Markdown语法

  • 最好入门的简明语法
  • 简明版 Markdown 语法说明(简体中文版)
  • 完整版 Markdown 语法说明(简体中文版)
  • GitHub Flavored Markdown
阅读全文 »

JDATA 腾讯广告赛

发表于 2017-09-30 | 阅读次数:
  • 本文是京东JData算法大赛-高潜用户购买意向预测和腾讯社交广告高校算法大赛的经历和总结

JDATA

  • 任务:通过数据挖掘的技术和机器学习的算法,构建用户购买商品的预测模型,输出高潜用户和目标商品的匹配结果,为精准营销提供高质量的目标群体
  • 参赛队伍4240 我的排名342

JDATA算是我第一次参加的大型带奖金比赛 =#= 大约是2017.4月我被我的好友机器变得更残忍拉入机器学习的坑。然后推荐我去kaggle打入门的house prices和digit recognizer。这时候JDATA已经开赛了,但萌新入门,完全不会。

还是先看kaggle上的kernels做入门题吧。4.16把houseprice做到1100名。在做house price时还不会处理非数值型数据,就简单把数值型的筛出来,然后用SVM跑了下。pandas也基本不会用(当时只是会python基础语法)。代码仅仅50行吧。

好歹有了点成绩,虽然很烂,但也可以稍稍激励下自己嘛。digit recognizer 到没有做出来,debug也不成功,放弃了。

这时候,JDATA也开了3星期左右了。 想着混混感受下氛围的原则,下载数据,准备开搞。在群里潜水了一段时间,发现有规则和模型2条路。模型,暂时不会用,先试试规则吧。比如前几周加到购物车但没有购买的,作为目标用户的购买意向物品。试了几个,发现效果还可以,最好的提交排名达到了600名。怎么办,语法有瓶颈而且规则确实不熟悉,不知道该怎么提分了。还是看看模型吧。

阅读全文 »

分类器评估方法对比

发表于 2017-09-25 | 阅读次数:

以一个有监督的二分类模型,模型对每个样本的预测为一个概率值,我们需选取一个阈值(cutoff)来区分好坏用户

假定我们已经定好了一个阈值,超过此阈值定义为(目标用户)1,低于此阈值定义为非目标用户(0),就可以计算出混淆矩阵(confusion matrix)

由上图我们可以得出TP.TN.FP.FN四个值。

  • precision:TP/(TP+FP)
  • recall:TP/(TP+FN)
  • F1:precision和recall的调和均值F1=2PR/(P+R) 相当于综合指标
  • Fα:F1的变体,Fα = (α^2+1)PR/(α^2P+R) 利用α给P、R赋不同权重

ROC曲线(receiver operating characteristing curve):是由多个混淆矩阵的结果组合,若在上述模型中没有定义好阈值,而是将模型预测结果从高到低排序,将每个概率值依次作为阈值,那么就要多个混淆矩阵。

阅读全文 »

配置SSH和hexo发布文章

发表于 2017-09-25 | 阅读次数:

##配置SSH
在git中执行下面命令生成SSH

ssh-keygen

  • 敲3次回车 生成id_rsa.pub,记事本打开复制SSH key的内容
  • 打开github,点击setting-SSH keys— Add SSH
  • 把复制的内容粘贴到下面框中,title随便填写

判断SSH是否配置好

ssh -T git@github.com

若出现
Hi XX! You've successfully authenticated,but Github does not provide shell access.
代表配置完成

阅读全文 »

如何利用hexo和github建立自己的网站

发表于 2017-09-12 | 阅读次数:

经过各种坑,我自己的第一篇个人网站博客终于到了正题了。话不多说,先介绍如何利用hexo搭建自己的个人网站。

  • 配置环境
  • node.js github git
  • 你需要一个GitHub账户,网站地址是:www.github.com 建议配置ssh keys 这样每次上传都不必手动输入密码了(有时间我下篇写如何配置ssh)
  • 安装桌面版GitHub会自带git(需要到指定位置运行) win10 bash也带有git git也可单独下载
  • 安装hexo 官网http://hexo.io/ 在node和git都安装好了 进入git hexo官网最下面 5条语句 依次输入
  • 下一步执行

    hexo server
    若报错,则执行命令$ sudo npm install hexo-server

  • 重试,出现INFO Hexo is running at http://0.0.0.0:4000/. Press Ctrl+C to stop.则表明成功在本地运行

  • 注:若安装福昕pdf,则可能无法运行,因为端口4000被其占用,改成hexo s -p 5000即可访问
    阅读全文 »

stan

9 日志
6 标签
© 2018 stan
由 Hexo 强力驱动
|
主题 — NexT.Muse v5.1.4